iOS 17.1 で OCR [道具]
iPhone で文字認識ができることは以前触れましたが、直接読み取る時だけでなく既に保存してある画像の中の文字も認識するようなので、今回テストしてみました。
使ったのは先日入手した資料で、記事を撮影して保存したものを認識させてみました。
スキャナと OCR ソフトの組み合わせを使ったことがありますが、認識率 99% であっても印象としては誤りが多いという印象でした。
100文字につき一文字間違うということなので、もうちょっと精度が上がらないと効率が悪いという印象でした。
ただ、専用のソフトでは画像と認識結果が見比べられるようになっていたのでチェックはやりやすかったですね。
記事一本を認識させてみましたが、この印刷物のように何段かの段組になっている場合は複数段を一度に認識させると、文字そのものはきちんと認識しながら段が異なる文字が混在することがありました。
苦手な文字というのもあります。
まずこの部分では活字二つ分を使う文字は認識できず、ーー となってしまいます。
これは仕方がないかなと思います。
こういう部分は罫線に置き換えて、文字の間が開かないようにします。
画像がありませんが、「駅」が「沢」になったところが一箇所ありました。
これも正しく認識できませんでした。
数字は認識できました。
これもちょっと酷ですね。
これも難しいですね。
...... になったり、...・・・ になったりしました。
「調」が「間」になっていました。
次に出てきた時は正しく認識しました。
なぜか「信」が抜けました。
文字数が合わなくなるのでちょっと不思議です。
(50) は 60 になっていました。
(34) が 3 になってしまったところも。
「警」が抜けたものが一箇所、「管」になったものが一箇所、「著」になったものが一箇所ありました。
「善」になったものもありました。
ルビは認識できませんでした。
名前も一字抜けました。
全体に字下げは苦手です。
行の最初からになってしまいます。
「衆」の文字が抜けていました。
「一」が抜け、 (24) も () が認識できませんでした。
こういう間が空いているものはダメですね。
「ふっ」が抜けました。
画像の鮮明さにもよるのかもしれません。
そのほか
━━ が ー になったり - になったり、!が !. になったりしました。
感嘆符はイタリックなので認識しづらかったかもしれません。
━━。 が ーー になった箇所が一つ。
? が 0 になったり ・ になったりしました。
一〇 が 10 になったところもありました。
入力しなくて済むのはとても楽なのですが、チェックはしないわけにはいきません。
文字が抜けるのがこんない多いとは思いませんでした。
しかし手入力するときのような漢字の違い(変換ミス、予測変換のおせっかい)や文字種(漢字、ひらがな、カタカナ)の違い、送り仮名の間違いはありません。
チェックの手間は同じなので入力の時間がほぼなくなることを思えばかなり省力化にはなりますね。
ノンブル(ページ番号)や写真のキャンプション、ヘッダーやフッターも認識するので、認識範囲を指定する必要があります。写さなければ良いのですが。
まあまあ便利かなと思います。
英語など外国語ですともっと精度が上がるのかもしれません。
認識させる画像の鮮明さも影響するかもしれません。
明日の朝はまた予約投稿するかもしれません。
※追記。
プリントしてチェックすると他にも次のような誤りがありました。
二コマ → ニコマ(漢字の 二 → カタカナの ニ)
二メートル → ニメートル
通用口 → 通用ロ(漢字の 口 → カタカナの ロ)
欠ける → 久ける
口をなめたり → ロをなめたり(漢字の 口 → カタカナの ロ)
あ─ → あー(横棒 → 長音)
格好 → 格年