もふもふ技術部

IT技術系mofmofメディア

OCR

Google Cloud Visionを使ってPythonでOCRしてみる

以前、Google Cloud Visionを使ってcurl経由でOCRを試した。 Google Cloud Vision APIでOCRを試してみる 今回はPythonで実装するとどんな感じになるのか試してみる。ひとまずVision APIの使い方のドキュメントを見直すところから。 https://cloud.google.com…

AWS Textractで書類をOCRしてみたけど日本語未対応やんけ

Amazon Textract(ドキュメントからテキストやデータを簡単に自動抽出) 表形式のテキストが抽出出来るらしいとのことで「これはアツいのでは」と思い、AWSのTextractを試してみる。 準備 aws-cliでOCR デモ画面 準備 公式ドキュメントを見ながら進めてみま…

Google Cloud Vision APIでOCRを試してみる

前回、Tesseractを使ったOCRを試してみました。続いて今度はGoogle Cloud VisionにもOCRする機能がある模様なので試してみます。 Tesseractでサクッと日本語OCRを試してみる デモやってみる curlでCloud Vision APIを叩いてみる まとめ デモやってみる GCPの…

Tesseractでサクッと日本語OCRを試してみる

TesseractはPythonからオープンソースで使えるOCRエンジンで、テッセラクトと読むらしい。とりあえずインストールしたらサクッとOCRを試せるみたいなのでやってみる。 こちらの記事を参考にした。 Tesseract+PyOCRで簡易OCRを試してみる - Qiita とりあえずO…