印章字林を自炊して研究会に持っていく荷物を減らす

  • 投稿カテゴリー:未分類
  • 投稿の最終変更日:2024年6月8日

かつては業界唯一の職業訓練法人で鶴見に事務所まで構えていた神奈川。
法人解散後の現在も月一回の研究会を横浜市技能文化会館で実施している。
だが会場が時間貸しの会議室ゆえ手元灯すら持参せねばならないので荷物が嵩張る。
嵩張るならまだしも字林は何かの修行かと思うほどの重さになる。
研究会なので印稿の添削が中心になるゆえ資料は網羅的にそろえたい。
ここには物理的な充実(小川香圭文庫)はないのだ。
今後のため、手始めに印章字林を自炊することにした。

おすすめの裁断機は4万円するので今回は店に転がってたスライドカッターで頑張ってみる。
自炊巧者の同業者曰く裁断機はズレるからカッターでやったほうがいいという助言。
→10~15枚ずつしか切り離せないうえに二度切りして切れ目が汚くなるなど散々な結果。
→ブログ執筆時点で昔の定番?らしいPK-513Lをヤフオク落札済み。


また裁断位置は
〇本の中身が中心になること
×出来るだけ少なく裁断
なので注意。素人は後者を採用し閲覧時にページが左右に振れるデータを作ってしまいがち。
複合機(MFC-J6983CDW)の上下自動判別はよく間違うので、原稿をバラバラにしてしまった!
という場合以外は使用しない方が良い。手間が増えるだけになった。
両面スキャンは便利、EPSON選ばなくて良かった。こんな機能もありますよ→使わなかった、にならなかった稀有な例。
傾き自動修正は不完全ながらそこそこ→シートスキャナーまではいいかな→よく見ると罫線がグニャグニャしてる画像があるな
→自分用だろ?→がまん
フォトショのアクションは便利だがなぜかCS2だと400枚を超えるから画像をいっぺんに表示させませんと怒られた。
→300+120としたら許してくれた。
OCR化しない場合は画像のままでpdfに固めないほうがいいかも→印章字林_!01と印章字林_001としたページ番号が反映されないから。
出来るらしいが、この程度の機能でも金払え。

[今後]翌日
OCR化したPDFにできたら検索できるようになると思った。
->複合機付属のブラザーのOCRじゃだめだろうな→意外と使い物になった。15年前のOCRがでたらめだった記憶。
行草まで認識したと思えば見出しの明朝を認識しなかったり不安定だが、あって困らない程度の精度はある。
これなら見出しまで手書きの篆刻字林のOCR化もいけるか。
残念な点:スキャンと同時にOCR処理することしかできないので、既存のデーターを生かすことは出来ない。
(昨日のデーターを生かせずまたADFに原稿を通した)
…いっぺんに380ページを処理したら30分経過しても完了しないので今夜はここまで。

[今後]
範囲指定できるOCRないかな、金払う。

コメントを残す