INTELLIBOTマニュアル

OCRText

OCRTextコンポーネントは画像からテキストを抽出します。

OCRTextコンポーネントのタイトルバーをダブルクリックし、OCR Settingsウィンドウを起動します。

1. Engine(OCRエンジン): Intellibotスタジオは次のOCRエンジンの使用をサポートしています。

Tesseract 4.0(LSTM)
Windows
ABBYY
Abbyy クラウド
Google クラウド
Microsoft クラウド
Amazon クラウド

2. Language(言語)：選択したOCRエンジンでサポートされているすべての言語を表示します。
既定の言語は「英語」です。

3. Search(検索)：選択したOCRエンジンのプロパティを検索できます。

4. Options(オプション)：選択したOCRエンジンに基づいてさまざまなオプションを有効にします。

ポート

OCRTextコンポーネントは、既定でコントロール入力ポート、コントロール出力ポート、データ入力ポート、データ出力ポートを持っています。

ポート	説明
Control In（コントロール入力）	1つ以上のコンポーネントのコントロール出力ポートに接続する必要があります。
Control Out（コントロール出力）	他のコンポーネントまたはコネクタのコントロール入力ポートに接続できます。
Data In (データ入力) - ビットマップ	他のコンポーネントまたはコネクタのデータ入力ポートに接続できます。
Data Out (データ出力) - 文字列	抽出されたテキスト（文字列）を返します。

ポート

説明

Control In（コントロール入力）

1つ以上のコンポーネントのコントロール出力ポートに接続する必要があります。

Control Out（コントロール出力）

他のコンポーネントまたはコネクタのコントロール入力ポートに接続できます。

Data In (データ入力) - ビットマップ

他のコンポーネントまたはコネクタのデータ入力ポートに接続できます。

Data Out (データ出力) - 文字列

抽出されたテキスト（文字列）を返します。

プロパティ

OCRTextコンポーネントのプロパティを編集するには、プロパティウィンドウで、必要なプロパティを変更できます。

次のプロパティを編集できます。

プロパティ	説明
Search	それぞれのプロパティを検索します。
Delay After Execution	アクションが実行された後（秒単位）の待機時間を指定します。
Delay Before Execution	アクションが実行されるまでの待機時間（秒単位）を指定します。
Name	OCRTextコンポーネントの名前を指定します。
Image Source	Image Source(画像ソース)には2つのオプションが表示されます： Port：画像の読み取り元となる別のコンポーネントに接続できます。 FilePath：保存された画像のFilePathを指定できます。

プロパティ

説明

それぞれのプロパティを検索します。

Delay After Execution

アクションが実行された後（秒単位）の待機時間を指定します。

Delay Before Execution

アクションが実行されるまでの待機時間（秒単位）を指定します。

Name

OCRTextコンポーネントの名前を指定します。

Image Source

Image Source(画像ソース)には2つのオプションが表示されます：
Port：画像の読み取り元となる別のコンポーネントに接続できます。
FilePath：保存された画像のFilePathを指定できます。

例

画像からのテキストを抽出する例を見てみましょう。

テキストを抽出するには：
まず、ReadFromFile コンポーネントを使用して、次のように読み取ることができる画像を OCR テキストに提供します。

1. ToolboxでUtilitiesを展開します。 2. Image Utilitiesを展開します。 3. ReadFromFileコンポーネントをドラッグして、デザインサーフェイスにドロップします。 4. FilePathをダブルクリックし、保存した画像のファイルパスを記載します。 5. OCRTextコンポーネントで画像をテキストに変換するには：

ToolboxでActionsを展開します。
OCRTextコンポーネントをデザインサーフェイスにドラッグアンドドロップします。

6. Showコンポーネントは抽出したテキストを確認するために使用します。 7. Showコンポーネントを追加するには：

Generalを展開し、Showコンポーネントをデザインサーフェイスにドラッグアンドドロップします。

8. 以下のコネクタを接続します：

StartコンポーネントとReadfromFileコンポーネント間のコントロールポート。
ReadfromFileコンポーネントのコントロール出力ポート　をOCRTextコンポーネントのコントロール入力ポート　へ。
ReadfromFileコンポーネントのデータ出力ポート　をOCRTextコンポーネントのデータ入力ポート　へ。
OCRTextコンポーネントのデータ出力ポート　をShowコンポーネントのデータ入力ポート　へ。
Messageboxコンポーネントのコントロール出力ポートをEndコンポーネントのコントロール入力ポート　へ。

9. Runをクリックします。 10. テキストの抽出が正常に行われると、次のようにメッセージボックスに表示されます。