ブログ移行計画 -その3- 移行スクリプト

ブログ移行計画 -その3- 移行スクリプト

移行スクリプトを作るぞ

weeblyからの移行がめんどくさい。
バックアップが取れるっぽかったのでそこからファイル解析してmarkdownに直せばいいかと思っていたがfeed分しか載っていないみたいで全部移行することはできなかった。

なので自分達で書いたブログを自分でクローリングする羽目になってしまった。

rubyでしれっと書くか

時間を取られたくもなかったので文字列操作それなりに緩そうなrubyで作成を開始。

  1. 全ブログをMISSEに取れるURLを探す
  2. 取れたhtmlから必要そうなコンテンツを取得する
  3. 取れたhtmlから画像を取得する
  4. markdownの文字列に変換する
  5. fileにwriteする
  6. link周りを修正する
  7. 体裁を整えるのを目視でやろう

結果的には最後に全部目を通すことになったのだが。
(どうしてもtag情報を綺麗に全部取るのがめんどくさかったので)

スクリプト

最終的にはscript(github)こうなった。

そんなに難しいことはなく、
nokogiri使ってhtml適当にさばいて、
各elementをclass化して、
element => markdownをセコセコ書き、
linkコンバートしておしまい。

振り返る

  • writeの仕方がまずかったかstringの改行周りにたまーに謎のバイト文字が入る
  • tagはやっぱ手でやってよかった
  • hugoでCJK使うには設定が必要
  • 3,4日で出来たのは良かった気がする

最終的にはこうなった