2012年09月16日

閲覧中ページの広告抽出ブックマークレット

広告ブロックhostsファイル生成に、hostsawayでは直接サーバにページ取得に行っている。
動的生成されるDOMオブジェクトを完全にチェックするにはjavascriptエンジンを実装する必要があるので、ブラウザに協力してもらう。
つまり、現在見ているページのHTMLから、ブラウザ側で外部リンクスクリプトを抽出して送信する、というブックマークレットを作った。

あからさまにアレなので某先生に突っ込まれないようセキュリティとプライバシーの検討。

セキュリティ
ユーザ固有のhostsを作るためのヒントに使われるだけので、フォーマットさえサーバ側で確認すればセキュリティ的には問題は無い。

ユーザのプライバシー
そもブックマークレットな上、送信するアドレスを明示してconfirmダイアログを出しているのでユーザの個別かつ明示的な同意を得ているはずで、URLの?以降も除去している。
URLはリンク先表示に使うだけで即時破棄されているので、サーバサイドでも個人情報的な問題は発生しない。

というわけで問題ないはず。
javascript:(function(){document.body.appendChild(document.createElement('script')).src='https://hostsaway.appspot.com/js/bookmarklet.js';})();
もしくはリンク

ブックマークレットでAppengine上のjsを読んでさらにjQueryのダイナミックロード、と少し重いけれど、だいぶ楽になった。

posted by ko-zu at 00:13| Comment(0) | TrackBack(0) | 広告・ユーザ追跡 | このブログの読者になる | 更新情報をチェックする

2012年09月14日

広告除去リスト更新

ウェブサイトから、広告と思われるホストファイルを半自動で生成するウェブアプリを作っている。
http://hostsaway.appspot.com/

ここに登録してある自分用ブラックリスト(主な広告・ユーザー追跡・クリック追跡を載せている)
http://hostsaway.appspot.com/userhosts/b697db559506405f
は、先のエントリにある自宅のDNSのサーバの広告ブロックリストに自動で入るようにしてある。

昔よく使われていたブックマークレット(ブックマークにjavascriptを登録して、表示中のページにjavascriptを読み込ませるテクニック)
を作って、幾つかサイトを巡回してみた。
javascript:location.href="http://hostsaway.appspot.com/test?targeturl="+escape(location.href);
( もしくは このリンクをブックマーク )

いわゆるまとめサイトを巡回してみる。まとめサイトのまとめサイトがあるので楽。
しかし本当に広告が多い。しかもメインは大概出会い系だったりする。

大体はPC用の広告だけれど、海外の広告ブロックリストには載っていないマイナーな広告業者もいくらかあったようだ。
adaway/adblockを外してみても大体異常に不快な広告類は消えたように思う。

なお、Wifi接続限定ながら、Androidやiphoneでroot化不要で広告ブロックを試せるので
挙動がおかしいサイトなどあればコメントなりtwitterなりで教えていただけるとありがたい。
posted by ko-zu at 20:07| Comment(0) | TrackBack(0) | 広告・ユーザ追跡 | このブログの読者になる | 更新情報をチェックする
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。