SSブログ

iOS 17.1 で OCR [道具]

iIMG_3111.jpg


iPhone で文字認識ができることは以前触れましたが、直接読み取る時だけでなく既に保存してある画像の中の文字も認識するようなので、今回テストしてみました。


使ったのは先日入手した資料で、記事を撮影して保存したものを認識させてみました。


スキャナと OCR ソフトの組み合わせを使ったことがありますが、認識率 99% であっても印象としては誤りが多いという印象でした。

100文字につき一文字間違うということなので、もうちょっと精度が上がらないと効率が悪いという印象でした。

ただ、専用のソフトでは画像と認識結果が見比べられるようになっていたのでチェックはやりやすかったですね。



i2023 11 04_0001.jpg


記事一本を認識させてみましたが、この印刷物のように何段かの段組になっている場合は複数段を一度に認識させると、文字そのものはきちんと認識しながら段が異なる文字が混在することがありました。


苦手な文字というのもあります。

まずこの部分では活字二つ分を使う文字は認識できず、ーー となってしまいます。

これは仕方がないかなと思います。

こういう部分は罫線に置き換えて、文字の間が開かないようにします。


画像がありませんが、「駅」が「沢」になったところが一箇所ありました。



i2023 11 04_0002.jpg


これも正しく認識できませんでした。

数字は認識できました。

これもちょっと酷ですね。



i2023 11 04_0003.jpg


これも難しいですね。

...... になったり、...・・・ になったりしました。



i2023 11 04_0005.jpg


「調」が「間」になっていました。

次に出てきた時は正しく認識しました。



i2023 11 04_0006.jpg


なぜか「信」が抜けました。

文字数が合わなくなるのでちょっと不思議です。


(50) は 60 になっていました。

(34) が 3 になってしまったところも。



i2023 11 04_0007.jpg


「警」が抜けたものが一箇所、「管」になったものが一箇所、「著」になったものが一箇所ありました。

「善」になったものもありました。



i2023 11 04_0008.jpg


ルビは認識できませんでした。

名前も一字抜けました。



i2023 11 04_0009.jpg


全体に字下げは苦手です。

行の最初からになってしまいます。



i2023 11 04_0011.jpg


「衆」の文字が抜けていました。



i2023 11 04_0012.jpg


「一」が抜け、 (24) も () が認識できませんでした。



i2023 11 04_0016.jpg


こういう間が空いているものはダメですね。



i2023 11 04_0017.jpg


「ふっ」が抜けました。

画像の鮮明さにもよるのかもしれません。

そのほか

 ━━ が ー になったり - になったり、!が !. になったりしました。

感嘆符はイタリックなので認識しづらかったかもしれません。

 ━━。 が ーー になった箇所が一つ。

 

[新月]? が 0 になったり ・ になったりしました。

一〇 が 10 になったところもありました。

 
入力しなくて済むのはとても楽なのですが、チェックはしないわけにはいきません。
文字が抜けるのがこんない多いとは思いませんでした。
しかし手入力するときのような漢字の違い(変換ミス、予測変換のおせっかい)や文字種(漢字、ひらがな、カタカナ)の違い、送り仮名の間違いはありません。
 
チェックの手間は同じなので入力の時間がほぼなくなることを思えばかなり省力化にはなりますね。
ノンブル(ページ番号)や写真のキャンプション、ヘッダーやフッターも認識するので、認識範囲を指定する必要があります。写さなければ良いのですが。
 
まあまあ便利かなと思います。
英語など外国語ですともっと精度が上がるのかもしれません。
認識させる画像の鮮明さも影響するかもしれません。
 
 
明日の朝はまた予約投稿するかもしれません。
追記。
プリントしてチェックすると他にも次のような誤りがありました。
 二コマ → ニコマ(漢字の 二 → カタカナの ニ)
 二メートル → ニメートル
 通用口 → 通用ロ(漢字の 口 →  カタカナの ロ)
 欠ける → 久ける
 口をなめたり → ロをなめたり(漢字の 口 →  カタカナの ロ)
 あ─ → あー(横棒 →  長音)
 格好 → 格年

nice!(6)  コメント(0) 
共通テーマ:パソコン・インターネット

サザンカが咲いた [花、植物]

i2023 11 03_0051.jpg


今朝は濃霧でした。

霧の向こうに丸い太陽が見えます。


写真は昨日の朝撮影したものです。



i2023 11 03_0032.jpg


皇帝ダリアの蕾が少し大きくなったようです。



i2023 11 03_0016.jpg


いつものように水滴ができています。



i2023 11 03_0021.jpg


i2023 11 03_0024.jpg


ランタナは最盛期のようです。



i2023 11 03_0028.jpg


i2023 11 03_0029.jpg


七変化とも呼ばれます。



i2023 11 03_0030.jpg


i2023 11 03_0031.jpg


i2023 11 03_0036.jpg


カンナの勢いが良いです。



i2023 11 03_0041.jpg


i2023 11 03_0057.jpg


コセンダングサは種子になったものが増えましたが、花も咲いています。



i2023 11 03_0059.jpg


i2023 11 03_0060.jpg


i2023 11 03_0063.jpg


i2023 11 03_0067.jpg


ヤマトシジミが何匹が見られました。



i2023 11 03_0069.jpg


i2023 11 03_0073.jpg


i2023 11 03_0080.jpg


i2023 11 03_0082.jpg


サツキが返り咲きです。



i2023 11 03_0085.jpg


何の穂だかわかりません。



i2023 11 03_0097.jpg


ベニバナトチノキに若い葉が生えていました。

春先のはずなのですが。



i2023 11 03_0098.jpg


淡い色のサザンカが咲いていました。



i2023 11 03_0099.jpg


椿の仲間で一番乗りです。



i2023 11 03_0102.jpg


続きは明日アップします。

nice!(8)  コメント(0) 
共通テーマ:趣味・カルチャー