連休4日目

今日は昨日に続いて So-net ブログの移転データの処理を行った。結局、記事を元通りの順番にリンクすることはできたのだが、考えてみれば、移転先の並び順を移転前に合わせる必要もないのだ。無駄な作業をしてしまったのかもしれない。

移転が必要なブログがもう1つある。Yahoo!ブログだ。こちらはブログサービスが終了するために引っ越しツールを Yahoo! JAPAN が用意してくれるというのだが、ページ内の相互リンクのような所までちゃんと対応してくれるかどうか怪しいと予想している。もちろん、そこを手作業でやる気は全くない。

連休3日目

今日は So-net ブログに投稿した自分の記事を他のサイトに転載するための処理を書いていた。意外だったのが投稿時刻で、ページを保存した HTML を分析した結果、秒まで含む情報は RDF の中にしか出てこない。RDF は HTML 的にはコメントの中に書かれているので、普通に HTML を parse しても取り出せないので少し困った。

もう一つ悩んだのが、前後の記事へのリンクである。元のページと同じ名前にすれば簡単なのだが、ちょっと余計なことをしてしまったのだ。

連休2日目

今日は朝にちょっと用事があって午後からプログラムを修正していたのだが、作っていたのは Selenium を使った自動処理。ブログのアクセス記録を自動的に取得する処理や、原稿を投稿して投稿済のフォルダーに移動するような処理である。

某ブログのアクセス記録は3か月経過すると削除されてしまうので、その前に保存する必要がある。これを手作業でやっていたのだが、自動化すると宣言してから何年も経っていたのが、今回から自動処理できそうである。

連休1日目

このタイトルだと楽に10日乗り切れるかな、と思いつつ…

この連休はいろいろ保留中のプログラムを仕上げようと思って、今日も朝からコーディング三昧だった。まずはリンクチェッカー。リンク切れに対応するプログラムである。20年ほど放置しているリンク集があって、それ位経過すると、同じドメインなのに全く違う会社のサイトになっていたりして、それはリンクが生きていると考えていいのかどうか悩んでしまう。もちろん正常にアクセスできてしまうので、プログラムだけで完全対応するのはとても難しい。

マイクロソフト社の新元号対応

公式ページにこんな記述があった。「全社態勢でソリューションの準備に取り組んでいます。」

年号が来月1日に変わることはかなり前から分かっていたのだが、マイクロソフトとしては100年計画で完璧なソリューションを求めようとしているに違いない。

リンク切れ

昔作ったリンクページをメンテナンスしようと思い立って作業しているのだが、想像以上にリンク切れのページが多い。それも、トップドメインに index_j.html と付いているために not found になるといった下らない理由のリンク切れが結構ある。ドメインが生きているのならトップページに飛ばすだけでリンクを生きたままにしておくこともできるはず。もったいないことだ。

差別

最近、とある掲示板で部落差別的な投稿が目立つ。そしてさらに不可解なのは、それを違反投稿として報告しても、なかなか削除されないことである。

今では部落差別は存在しないという人もいるようだが、投稿の内容からは、部落差別的な思想が根強く残っているような気がしてならない。

それにしても、指摘しても削除されないというのが分からない。まさか大手が部落差別を容認しているとは思えないので、担当者がそれと認識できていないのかもしれない。

スキーマ

とある所に書いた文章にスキーマという言葉を使ったのだが、しばらく経ってから、これはスキームと書くべきかと悩み始めてしまった。そもそもスキーマとスキームの違いに関して漠然とした理解しかないことも気付いた。

ただ、そこを読んでいる人達が、その違いを理解しているかというと、それもなさそうな気がしてきた。自分で言うのも何だが、伝わらないような言葉を使って一体何がしたいのだろう。

自動化

手作業でやっているいろんな処理を次々と自動化しようという計画を着々と進行させている。コンピュータの何が便利かというと、単純な作業の自動化なのだ。大型連休もかなり接近してきたが、それまでにできるだけ前倒しでやろうという計画だ。

面倒なことはPyhton にやらせよう、という本があるが、趣旨としては同感である。ただ、Python にこだわる必然性はない。手段は問わない。