質問:
HTMLのコピー:著作権違反?
scraper
2015-08-13 22:24:22 UTC
view on stackexchange narkive permalink

(ここで質問するようにアドバイスされた職場SEからこれを再投稿します。ご不便をおかけして申し訳ありません)

tl; dr :米国では、サイト(コードが著作権で保護されていると思われるサイト)からHTMLコードをコピーして、限られた時間または無制限の期間、著作権の侵害として保存していますか?これに関連する以前の訴訟はありますか?私は主に、コピーが複製されないが非公開にされる特定のケースに興味があります。


最近、これが実際に当てはまることがわかりました。これは私にとって大きな驚きでした。

  1. [まず第一に]ほとんどのブラウザはHTMLのコピーを保持します(キャッシュが有効になっている場合は、訪問期間またはそれよりずっと長く)
  2. プロキシサーバーはこれらのファイルのキャッシュコピーを保持することがよくあります
  3. Webアーカイブ(Googleなど)は、これらのページの履歴バージョンを保持するために見つけたサイトのすべてのアセットをコピーするだけでなく、一般の人々はこれらの歴史的なコピーを公開しています。
  4. 外部サイトをスクレイプするプログラムは、テスト目的で(著作権で保護されている可能性が高い)HTMLのコピーをリポジトリに保存することがよくあります。
  5. ol>

    番号(4)は私たちがWeb分析を行っているため、他のサイトにアクセスするプログラムを作成しているため、私が働いている会社に直接影響を与えるものです。たとえば、 vcrpyライブラリを多用して、外部アクセスを記録し、これらの「凍結された」HTMLに対してコードをテストします。

    また、特にこの場合は、私たちはそのページのサブセットのみに関心があるので、実際にはすべてのサイト全体をコピーしますが、私が聞いたところによると、それは本の一節を引用するなどの「フェアユース」とは見なされないようです。 (ある意味で、この本はすべての公共資産を含むサイト全体に類似しています)。 CSSファイルや画像などのアセットもコピーしないため、実際のコンテンツを完全に複製することはできません。

    そのようなコピーは違法である可能性が高いと言われた後、私たちはより堅牢なテスト方法論(ローカルストレージのWebからコピーされた大量のHTMLを利用する可能性が高い)だけでなく、現在のvcrpyライブラリの使用は、分析を必要とするものになりました(使用が違法であるかどうかが明確でないため)。

これについてあなたが見つけた判例法は何ですか?
二 答え:
Petr Hudeček
2015-08-14 02:48:01 UTC
view on stackexchange narkive permalink

あなたは明らかに法的助言を求めています。このサイトの回答はインターネット上の匿名の人々からのものであり、法律上の助言ではありません。このサイトの情報に基づいて行動するべきではありません。

個人的な使用のためにHTMLを保存して読み取るだけで訴えられる訴訟を私は知りません。

ウェブページのダウンロードは、おそらく著作権侵害ではありません。 HTMLソースコードを含め、作成するほとんどのものは著作権によって保護されており、著作権には、誰が何を読むことができるかを選択する独占的権利が含まれます。あなたが作成しました。これへの実際の参照は見つかりませんでしたが、HTML Webページをオンラインで表示すると、他の人がそのコードを暗黙的に読み取れるようになると推測するのは危険です。最近のすべてのWebブラウザーには、誰も違法とは見なさないソースを表示する機能があり、ブラウザーにはWebページをディスクに保存する機能も含まれているため、この推測は正しいと思います。これらのブラウザは大規模な法務部門を持つ企業によって作成されています。これを使用することが著作権侵害である場合、InternetExplorerにこの機能が含まれるとは思えません。

ここから推測が始まります:

ただし、拡張された質問では、HTMLコードを読むだけでなく、HTMLコードを処理し、そこから情報を抽出して、この方法で学習した内容を使用したいとしています。これは、著作権者によって防ぐことができると思います。それでも、あなたが説明していることは、世界で一般的に行われています。 Google、Bing、Wayback Machineなどのサービスは、あなたがしていることをはるかに超えています。理論的には、これは著作権侵害であると見なすことができますが、これらの大企業が、ウェブサイトの所有者とのいかなる契約もなしに、それを継続しているという事実は、合法性を支持する大きな証拠です。ウェブページの保存。

ただし、保存されたデータの使用方法には注意が必要です。たとえば、コンピュータプログラムのEULAには、コードのリバースエンジニアリングを禁止する規定が含まれていることがよくあります。一部のWebサイトの使用は、このような方法で保護できることがわかりました。

このトピックに関するその他の(信頼できない)インターネットページ:

MSalters
2017-11-21 16:56:48 UTC
view on stackexchange narkive permalink

著作権は、保護された作品のコピーを作成するための特定の権利です。 Webサーバーの所有者は、おそらくそのWebサーバー上のコンテンツの著作権所有者です。したがって、Webブラウザが要求したときにWebサーバーがHTMLドキュメントのコピーを自動的に作成する場合、これは通常、著作権違反ではありません。

Webブラウザは、それらのコピーを保持する期間を約束しません。それらを保持することは、契約違反を構成するものではありません。 (著作権で保護されたドキュメントの保持または使用は、著作権法で保護されている行為ではありません。)

Webサーバーは、プロキシサーバーに「キャッシュしない」などのキャッシュのヒントを与えることができます。 Webアーカイブにも同様のプロトコルが存在します。これらのプロトコルに従わないということは、コピーの許可を意味します。これは、Webページを公に投稿することの一般的に理解されている意味です。

4回目の使用は確かに最も難しいかもしれません。技術的な互換性の目的で上記のデータを使用しており、著作権法が保護しようとしている作者の権利を妨害していないという点で、フェアユースの防御がある可能性があります。 (フェアユースは「小さな部品はOK」の同義語ではありません)しかし、フェアユースは防御であり、絶対的な権利ではなく、文脈の中で考慮する必要があります。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...