今日はブログ移転のためのプログラム作成を続いて行った。何とダウンロードした記事の構造が途中で変わっていることが判った。ということは、同じような取り出し方をしても本文が取り出せるファイルと取り出せないファイルがあることになる。
見た目は分からないのだが、内部的な構造が違う。ブログの場合、静的ページを一度生成したら最後までそれを再利用するというサーバーが多いのではないか。もしかすると全記事を更新したら同じ形式になるのかもしれないが、そこまでする意味があるのか、というのはちょっとモヤモヤした感じがある。