tDiary 2.2.1へのアップデートのついでに、RSSの出力先を変更した際のメモ。tDiaryでは、デフォルトのRSSにはツッコミが含まれてしまうので、単純にRSSの出力先ファイルを入れ替えることで対処。makerssの設定に"RSSにはツッコミを含まない"というチェックボックスがあれば、それですむんだけどなあ。本体を改造するのもアレなので、tdiary.confレベルで作業。
ということで、デフォルトのindex.rdfのフィードを取得している場合は、spamなどのツッコミが混じらなくなりました。ツッコミ混じりのRSSをヲチしたい人は、comments.rdfのほうのフィードを取得してください。
□ tDiaryで標準のRSSにツッコミ(コメント)を含ませない方法 下記の方法では、ツッコミを含む/含まないRSSの2種類を出力します。 tDiaryの設定画面の「プラグイン選択」で、「makerss」を有効にしておく。 同じく「フィード(RSS)の生成」で、ツッコミ抜きのフィードを「配信する」 に設定しておく。 index.rdfが設置してあるフォルダで $ touch comments.rdf を実行して、空ファイルを作っておく。 tdiary.confに以下の行を追加 --------------------------------------------------- # My Setting @options['makerss.file'] = 'comments.rdf' @options['makerss.no_comments.file'] = 'index.rdf' @options['makerss.no_comments.suffix'] = '' --------------------------------------------------- これで、ツッコミを含むRSSはcomments.rdfに、ツッコミを含まない RSSはindex.rdfに出力される。サイト名も変わらず出力される。 tDiary.org - tDiary 2.2.1リリース http://www.tdiary.org/20080229.html tDiaryドキュメント - フィード(RSS)の生成 http://docs.tdiary.org/ja/?makerss.rb tdiary.org - ツッコミ抜きのフィード(RSS)も生成しましょう http://www.tdiary.org/20080119.html
もともと、tDiaryを2.2にした際に、デフォルトのspamフィルタで優秀にspamを弾いてもらえるものの、URLを1行だけ含むようなコメントspamには無力でした。なので、tDiaryコメントのNGワードに「href」や「url=」などを追加して、リンクを貼ろうとするspamを排除。
tDiary 2.2.1からは、一定日数より前の日記のコメント欄を、JavaScriptで生成する機能が追加されたので、その効果も見てみたいところ。
tDiaryでツッコミspamを避けるための工夫 →tDiaryの設定の「spamフィルタ」でツッコミのNGワードとして 「url=」や「href」を登録しておく。 tdiary.org - 効果的なspamフィルタの設定方法 http://www.tdiary.org/20080122.html
Web解析だけでなくて、コマンドラインでログ解析をするのが趣味だったりするので、おかしなアクセスが多数あった場合は、ApacheレベルもしくはtDiaryの設定レベルで投稿/アクセスを拒否しています。
ちょっと前に、一部のコメントspam対策で設定したメモをあげておきます。
最近の20万件のアクセスログのうち、GETでおかしなリファラを送ってくる ホストとリファラの統計/ランキングを取ってみた。結果は以下の通り。 ------------------------------------------------------------------- 16 v046184.dynamic.ppp.asahi-net.or.jp http://www.dietjp.org/ 15 sv362.lolipop.jp http://pinkey.dip.jp/diary2 8 122.18.240.243 http://youtube0.dreamhosters.com/index.php?feed=FSX 7 hprm-15676.enjoy.ne.jp http://moccori.10.dtiblog.com/ 6 tetkyo052085.tkyo.te.ftth2.ppp.infoweb.ne.jp http://www.natural-leaf.net/ 4 p6071-ipbf208hodogaya.kanagawa.ocn.ne.jp http://bigmoney.husuma.com/adsense_no1.html 4 kd121110117231.ppp-bb.dion.ne.jp http://bloger.x0.com/result 4 em60-254-248-90.pool.emnet.ne.jp http://www.saiyasuweb.com/2 4 em117-55-7-134.pool.emnet.ne.jp http://www.saiyasuweb.com/2 4 75.125.162.74 http://www.stockleaf.com/directory 4 106.169.138.210.bf.2iij.net http://xn--pckht2b8fvfybx579ful6b.com2net.biz/ 3 221.113.218.197 http://youtube5.dreamhosters.com/index.php?feed=orca 3 117.55.7.134 http://www.saiyasuweb.com/2 3 106.169.138.210.bf.2iij.net http://asa-dachi.net/ 2 p24010-adsao01atuta2-acca.aichi.ocn.ne.jp http://bloger.x0.com/result 2 75.125.165.10 http://www.stockleaf.com/directory 2 70.87.15.50 http://www.stockleaf.com/blogs 2 70.84.168.114 http://www.stockleaf.com 2 61.125.96.74 http://youtube0.dreamhosters.com/index.php?feed=FSX 2 221.125.51.225 http://idol-photo.dreamhosters.com/\xa6\xdd\xa4\xab\xbb\xf6\xa4H 2 122.18.240.243 http://youtube7.dreamhosters.com/index.php?feed=FSX ------------------------------------------------------------------- 上位2つのwww.dietjp.orgとpinkey.dip.jpは同一ホストからのアクセスのみで 明らかにたちの悪いspamなので拒否。www.saiyasuweb.comはemnet.ne.jp= イー・モバイルからのアクセスしかない同類と判断して拒否。 その他の、リファラについてはtDiaryの"リンク元記録除外リスト"として登録。 ひどいようなら、Apacheレベルでホスト/リファラを拒否します。 (iptablesがいじれる鯖環境なら、iptablesで色々できるんですが) もし拒否する場合は .htaccessファイルに以下の例のような内容を追加。 (ただし、apacheサーバでmod_setenvifモジュールが有効になっていること) ------------------------------------------------------------------- SetEnvIf Referer "dietjp\.org" SPAM SetEnvIf Referer "saiyasuweb\.com" SPAM SetEnvIf Referer "pinkey\.dip\.jp" SPAM Order Allow,Deny Allow from all Deny from env=SPAM -------------------------------------------------------------------