Plaggerで全文取得 (3)・任天堂系ゲームニュースサイト『iNSIDE』のニュース記事を取得
PlaggerのEntryFullTextプラグイン用に自分で作って使ってるyamlファイルをちょぼちょぼと公開します。いわゆる野良EFTってやつです。
任天堂系のゲームニュース&コミュニティの総合サイト『iNSIDE』のニュース記事をPlaggerを使用して取得します。
任天堂ファンやWii、ニンテンドーDSのゲーム情報が気になる方は必見のサイトです。
PATH: assets/plugins/Filter-EntryFullText/inside_games.yaml
# inside games # http://www.inside-games.jp/news/ author: Kazuya@glassleaf handle_force: http://www.inside-games.jp/news/ extract: <SPAN style='font-size:14px'>(.*?)</SPAN>.*?<SPAN style='font-size:15px'>(.*?)</SPAN> extract_capture: date body extract_date_format: %Y年%m月%d日\([日月火水木金土]\) %H時%M分
日時情報取得で日本語を使用していますので保存する文字コードに気をつける必要があります。
文字コードはUTF-8、改行コードはLFという感じで。
iNSIDEはつい最近まで国内最大のゲーム系個人ニュースサイトでしたがIRIのメディア部門が買収し今月からはPCのネットワークゲーム・モバイルゲームに関するニュースも新たに配信しています。
その件については、こちらで書いてます。
Nintendo iNSIDEが買収された | Glassleaf (2007年06月02日)
追記(2007年6月13日)
iNSIDEのRSSに概要文が含まれるようになって本文取得出来なくなったのでアップデートしました。
handleをhandle_forceに変更して概要文があっても取得しにいくようにしただけです。








