「電子書庫・書籍・ノート」でのキーワード検索は、OCRソフトによって得られた文字コードを対象にしています。現在のOCRソフトの識字率は、100%ではありません。従って、文字画像にキーワードが含まれていても、文字コードとして取得されないと、キーワードが検出できません。そこで、どのような場合に、OCRソフトが不都合を生じるかを認識した上で、以下の点に留意し、適切なキーワードを選択する必要があります。
@ 複雑な漢字は避けます。
A よく似た形の文字があります。
数値の「1」,「T」と英字の「I」,「l」、数値の「0」と英字の「O」、「ー」,「−」,「―」,「-」
カタカナの「ニ」と漢数値の「二」、カタカナの「ソ」と「ン」、「シ」と「ツ」、
カタカナの「エ」と漢字の「工」、
B 「佐賀」が「佐嘉」のように、別字体が用いられることがあります。
C 漏れなく検索するためには、よく似た字や別字体を含むキーワードを複数用い、or 検索を行います。
D 複雑な漢字やよく似た文字は、空白に置き換えて、and 検索を行います。
電子ノートの文字列の置換
文字列の置換を、電子ノートを対象に行います。 これにより、OCRの不都合による文字列を、一括して修正することが可能になります。
@ 旧文字列と新文字列を入力します。最大で5種類まで、同時に置換できます。例は、「負ぶ」を「負ふ」への変換
A 置換の対象となるノートの種類、目次・索引・栞 テキスト メモ をチェックします。
B 一括変換 確認あり を選択します。
C ボタンをクリックします。