PlaggerのEntryFullTextプラグイン用に自分で作って使ってるyamlファイルをちょぼちょぼと公開します。いわゆる野良EFTってやつです。
Message from Utada Hikaru / Utada
宇多田ヒカルのオフィシャルサイトに彼女が書いている日記がありますが、残念ながら一般に使用されてるブログシステムとは違うので購読用のRSSなどは用意されてません。そこでPlaggerを使ってコンテンツをサイトから全文取得してフィード化しRSSリーダーで本文を購読出来るようにします。
PATH: assets/plugins/Filter-EntryFullText/Utada.yaml
# Message from Utada Hikaru / Utada # http://www.u3music.com/message/ author: Kazuya@glassleaf custom_feed_handle: http://www.u3music.com/message/ custom_feed_follow_link: /message/.*?xml handle: http://www.u3music.com/message/.*?xml extract: <div class="blue">(.*?)</div>.*?(<!--Photo - start-->.*?)<!--Text - end--> extract_capture: title body
日付を取得しようと頑張ったのですがどうしても出来なくてそのままにしてあります。誰か教えてください。
最近のウタダ日記は彼女の書いた"あじわいぶかい"イラストがアップされていて、なんかしょこたんぶろぐみたいになってますね。
歌だけではなくて絵もうまかったのか。
2007年7月5日 追記
Kojiさんからトラバが届きました。
Plaggerで宇多田ヒカルの日記をRSS化 - koji's blog
その手があったか!でもあり、そんな事が出来るのか!って感じでもあります。
窓使いであまり馴染みのない正規表現はサイトのテストをするためにスクリプト言語を触るときもいつも苦手としている部分なので前方参照とかまったく知りませんでした。
正規表現を使いこなすとこんな便利な事が出来るんですねぇ。勉強になりました。
そして、KojiさんのエントリでPlagger界の重鎮Otsuneさんにこの記事が取り上げられていた事を知りました。
subtech - otsune's SnakeOil - 宇多田ヒカルの日記用EFTを改造
やはり年号が無いとDateTimeは取れないんですね。
こちらはXpathでエレガントに要素抽出してます。
と、ひとしきり感動したので実際にEFTにコピペして実行してみました。
が、、、二つとも失敗しました。
なぜ!?
Windowsだから?Plaggerのバージョンのせい?
プラグインが足りない?Perlのモジュールの問題?
PlaggerのインストールではじめてPerlのリポジトリを触った程度の知識しかないので解決するまで先は長そうです。










