Plaggerで全文取得 (1)・宇多田ヒカルの日記を攻略するPlaggerで全文取得 (1)・宇多田ヒカルの日記を攻略する

| トラックバック(1)

PlaggerEntryFullTextプラグイン用に自分で作って使ってるyamlファイルをちょぼちょぼと公開します。いわゆる野良EFTってやつです。

Message from Utada Hikaru / Utada

宇多田ヒカルのオフィシャルサイトに彼女が書いている日記がありますが、残念ながら一般に使用されてるブログシステムとは違うので購読用のRSSなどは用意されてません。そこでPlaggerを使ってコンテンツをサイトから全文取得してフィード化しRSSリーダーで本文を購読出来るようにします。

PATH: assets/plugins/Filter-EntryFullText/Utada.yaml

# Message from Utada Hikaru / Utada
# http://www.u3music.com/message/

author: Kazuya@glassleaf
custom_feed_handle: http://www.u3music.com/message/
custom_feed_follow_link: /message/.*?xml
handle: http://www.u3music.com/message/.*?xml
extract: <div class="blue">(.*?)</div>.*?(<!--Photo - start-->.*?)<!--Text - end-->
extract_capture: title body

日付を取得しようと頑張ったのですがどうしても出来なくてそのままにしてあります。誰か教えてください。

最近のウタダ日記は彼女の書いた"あじわいぶかい"イラストがアップされていて、なんかしょこたんぶろぐみたいになってますね。
歌だけではなくて絵もうまかったのか。

2007年7月5日 追記

Kojiさんからトラバが届きました。

Plaggerで宇多田ヒカルの日記をRSS化 - koji's blog

その手があったか!でもあり、そんな事が出来るのか!って感じでもあります。
窓使いであまり馴染みのない正規表現はサイトのテストをするためにスクリプト言語を触るときもいつも苦手としている部分なので前方参照とかまったく知りませんでした。
正規表現を使いこなすとこんな便利な事が出来るんですねぇ。勉強になりました。

そして、KojiさんのエントリでPlagger界の重鎮Otsuneさんにこの記事が取り上げられていた事を知りました。

subtech - otsune's SnakeOil - 宇多田ヒカルの日記用EFTを改造

やはり年号が無いとDateTimeは取れないんですね。
こちらはXpathでエレガントに要素抽出してます。

と、ひとしきり感動したので実際にEFTにコピペして実行してみました。

が、、、二つとも失敗しました。

なぜ!?
Windowsだから?Plaggerのバージョンのせい?
プラグインが足りない?Perlのモジュールの問題?

PlaggerのインストールではじめてPerlのリポジトリを触った程度の知識しかないので解決するまで先は長そうです。

ブックマークに追加する

Comments and Trackbacks

このブログ記事について

このページは、Kazuyaが2007年6月 9日 15:06に書いたブログ記事です。

ひとつ前のブログ記事は「Winnyによる情報流出でついに自殺者」です。

次のブログ記事は「ボーイッシュに変身した堀北真希が初お披露目」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。