(ここで質問するようにアドバイスされた職場SEからこれを再投稿します。ご不便をおかけして申し訳ありません)
tl; dr :米国では、サイト(コードが著作権で保護されていると思われるサイト)からHTMLコードをコピーして、限られた時間または無制限の期間、著作権の侵害として保存していますか?これに関連する以前の訴訟はありますか?私は主に、コピーが複製されないが非公開にされる特定のケースに興味があります。
最近、これが実際に当てはまることがわかりました。これは私にとって大きな驚きでした。
- [まず第一に]ほとんどのブラウザはHTMLのコピーを保持します(キャッシュが有効になっている場合は、訪問期間またはそれよりずっと長く)
- プロキシサーバーはこれらのファイルのキャッシュコピーを保持することがよくあります
- Webアーカイブ(Googleなど)は、これらのページの履歴バージョンを保持するために見つけたサイトのすべてのアセットをコピーするだけでなく、一般の人々はこれらの歴史的なコピーを公開しています。
- 外部サイトをスクレイプするプログラムは、テスト目的で(著作権で保護されている可能性が高い)HTMLのコピーをリポジトリに保存することがよくあります。 ol>
番号(4)は私たちがWeb分析を行っているため、他のサイトにアクセスするプログラムを作成しているため、私が働いている会社に直接影響を与えるものです。たとえば、 vcrpyライブラリを多用して、外部アクセスを記録し、これらの「凍結された」HTMLに対してコードをテストします。
また、特にこの場合は、私たちはそのページのサブセットのみに関心があるので、実際にはすべてのサイト全体をコピーしますが、私が聞いたところによると、それは本の一節を引用するなどの「フェアユース」とは見なされないようです。 (ある意味で、この本はすべての公共資産を含むサイト全体に類似しています)。 CSSファイルや画像などのアセットもコピーしないため、実際のコンテンツを完全に複製することはできません。
そのようなコピーは違法である可能性が高いと言われた後、私たちはより堅牢なテスト方法論(ローカルストレージのWebからコピーされた大量のHTMLを利用する可能性が高い)だけでなく、現在のvcrpyライブラリの使用は、分析を必要とするものになりました(使用が違法であるかどうかが明確でないため)。