Plagger

del.icio.usは読まなくていいと思ったので

feedburnerでフィードをまとめているようなblog*1のとき、del.icio.usの内容までは別に読みたくないので、Plaggerのconfig.yamlにRuleを書き足してみました。 - module: Filter::Rule rule: module: Expression expression: $args->{entry}->{link} !~ m{^ht…

EFTかいたり

全文配信してないフィードは読むのがめどいです。

Aggregator::Xangoが微妙に挙動不審

なので、Aggregator::Simpleに戻してみました。なんか同じフィードを3回くらい処理してる。どのフィードも、ってわけじゃなくて、手元だとどうもはてなダイアリーのRSSだけみたい。あとCustomFeed::Configで読んでるhttp://sakuraba.if.tv/diary/の更新を拾…

fc2

とりあえずXPathでもって私が見てるblogで動くだけのEFTは書いてあるけど、続きを読むのあたりちょっとアレだなぁ。正規表現でゴニョゴニョしたほうがいいかもしれない?

Aggregator::Xango

を導入してみた。差はわからないけど、ま、遅くなってる感はないし。

config.yaml

ちょろっと手を入れてみたり。ちょっと幸せになったかな。今のところこんな感じ。購読してるフィードはもうすこしあるけど、ちょっとアレなのでいくつか削ってあります。 global: assets_path: D:/Plagger/assets cache: base: D:/Plagger timezone: Asia/To…

また…

まいじゃーがまたエラーになってる。あそこ何回EFTに手を入れたかわからないよもう。MTでもWPでもいいからなにかよそでも使われてるような標準的なシステムを使ってくれればいいのに。 Maidsphereも変更がきてるなぁ。後で手を入れておこうっと。 ついき ま…

まいじゃー推進委員会!

まいじゃー推進委員会!はフィードを全文配信してくれないので、Plaggerで読んでるんだけど、あそこのHTML絶対おかしいって。ぐちゃぐちゃすぎる。ありえない。おかげでXPathも使えないし、正規表現もめちゃくちゃ。また手を入れる羽目になりました。多分私…

複数入力

入出力が複数なrecipe - Seacolor Labs. - Plaggerグループを参考にしてやってみました。100SHIKI.COM、i d e a * i d e a、P O P * P O P、S i M P L E * S i M P L Eを1つにして読んでみる。P O P * P O PだけはEFTを噛ませないといけないみたいだけど。購…

キャッシュ

assetsとソースを比べながら確認しても全文取れるはずのものが取れてないと思ったら、単に手元に古いキャッシュが残ってて、キャッシュがあるものだからWeb上の更新を無視してそっちを参照してるからうまく取得できてないだけでした。そこのサイトのキャッシ…

HTMLタグの入れ子を間違えるなー。あとXPathは便利だけどちょっと遅い

とあるサイトのフィードを全文で読みたいので、XPathで//div[@class="blogbody"]と指定したけど、1個だけきちんと全文取得できてないエントリがある。おかしいなと思って、そのエントリのHTMLソースを読んでみたら、 <div class="blogbody"> <p><div class="quote">ほげほげ</p> <p>ふがふが</div></p> </div> これ、HTMLタグの入…

cronやめる

私の場合はcronを常駐させるよりも必要なときに必要なconfig.yamlだけplaggerに処理させたほうが便利っぽい。plaggerにまかせてるフィードが多いから常用してるマシンでplaggerを走らせるとcronを実行するたびにサービスにCPUを持っていかれてちょっと重くな…

assetsが

どこかおかしいなぁ。もう少し手を入れないといけない。いちいちクリックして読むなんて面倒なことしたくないです。多少面倒でもそのためにassetsを書くのが正義。 追記 (02/18 19:00) assetsの問題じゃないや。EFTのフェーズでタイムアウトするとか、HTTPレ…

今日もそれPla

いつのまにかそれPlaしてるblogも20件。情報に対してだんだん貪欲になってきてる感じ。

XPath

EFTで切り出す範囲を指定するのはXPathのほうがはるかに簡単だけど、正規表現で書いたほうがやっぱり軽いよなぁ。あと、まいじゃーのところは書いてみたけどすごく汚い。XPathで切り出して、不要な部分をextract_after_hookで削除してる。パターンがよく分か…

assetsいじり

少しずつPlaggerで読むサイトを増やし中。それはそうと、Plagger rev.1918に入ってるEFTのだけど、Livedoorブログのとはてなダイアリー用のが、全文取得できないページがあるのと、LivedoorのはRSSアグリゲータで変な表示になるので、少し書き直しました。こ…