備忘録

イケイケエンジニアになるために自己嫌悪と戦う大学院生のメモ兼モチベーション維持。

ディープラーニングするぞ

久しぶりに時間が取れたので文字切り出し・ノイズ低減(削除)・モアレ除去など試して見たがなかなかうまくいかない。 そもそも環境光の異なる(予測できない)状況下において、 古典的画像処理で全ての状況に対応しようという試みが間違っているのだろうと思…

Kodak PIXPRO SP360-4K のWifiストリーミング環境構築

Kodak社のPIXPRO SP360-4Kは1台で半天球、2台合わせて全天球映像を撮影可能なカメラである。 PIXPRO - マスプロ電工|MASPRO UVC規格対応でUSBケーブルによる接続でWebカメラとしても利用できるが、 Wifiルータを内蔵しており映像をストリーミングできる機能…

Goやりたい

Go

最近Go言語をやりたい欲が強くなってきた。 なぜ リアルタイム通信系のサーバサイド技術勉強したい → Node.jsかGo言語やりたい → リサーチ → Go言語の魅力に惹かれている 魅力に思うところ コンパイル型の静的型付言語 自分はC -> Java -> C# -> C++ -> php …

Pythonによるスクレイピング&機械学習 開発テクニックを買った

夕飯の買い物ついでにふらりと寄った書店で技術書を買った。 Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう作者: クジラ飛行机出版社/メーカー: ソシム発売日: 2016/12/06メディア: 単行本この…

adaptiveThresholdさん見直し

2値化の処理を探っているとき、cv2.adaptivethreshold()があまり使えないように思っていたが、ただ単に自分のチューニング不足だった。 cv2.adaptivethreshold(image, method, blocksize, c) 画像のしきい値処理 — OpenCV-Python Tutorials 1 documentation …

kNNで文字認識

kNNとは k近傍法(k-nearest neighbor)。かなり単純なクラスタリングのアルゴリズム。 教師データ(ラベリング済)を特徴ベクトル化して学習 クラスタリング対象のデータも特徴ベクトル化 特徴ベクトルの距離を比較し、対象データと近い順にk個の教師データを選…

macOS10.12 x Objective-C x 32bit(i386)でビルドエラー

ちょっとした理由があり、SwiftではなくObjective-CでOSXのアプリケーションを書いている。 初遭遇するタイプのハマり方をしたのでメモ書き程度に残しておく。 問題 Architectures を64bit(x86_64)なら問題なくビルドできる Architectures が32bit(i386)の時…

文字位置切り抜き

学習用の画像を集めていくうちに文字位置の切り抜きに失敗することが多くなり、 このままではロバストな認識は行えないということで改善を試みた。 スコア部分の切り抜き 画像によってヘッダの認識にずれがあり、切り出したスコア部分に欠けが生じることがあ…

画像傾きの補正

文字認識その他色々な処理の前に画像の傾き(回転)を自動補正したいのでやった。 方法 cv2.Canny() でエッジ検出 → cv2.HoughLinesP()で直線検出 → 水平方向の直線の平均角度を取る → 直線が水平になるように画像全体を回転 # 画像の傾き検出 # @return 水…

Tesseract-OCRの学習を試してみる

文字位置特定→文字画像を切り出し→kNNで文字認識 という流れを踏む予定だったが、安定した文字位置の特定処理が難しいのでTesseract-OCRを試してみる。 学習前の状態でOCR Tesseract v3.04 $ tesseract number.png out Tesseract Open Source OCR Engine v3.…

スコア部分の文字列切り出し

前回まででスコア表示部分のヘッダーが取れたので、その下のスコア表示部分を切り抜き、文字認識に繋げる スコア表示部分切り抜き ヘッダ検出結果から、その下部の領域を適当に切り出す 欠けてしまうと文字認識が失敗するため、無駄な部分が入ろうとも大きめ…

スコアヘッダ認識2

認識失敗時に回転させる処理を追加したら割とうまくいった。 import os import dlib import cv2 from scipy import ndimage IMG_DIR = './experiment_img/' cv2.namedWindow("img", cv2.WINDOW_NORMAL) detector = dlib.simple_object_detector("detector.sv…

スコアヘッダ認識

やりたいこと リザルト画像中からスコア表示部分のヘッダを認識する 手段 機械学習ライブラリdlibの物体検出モジュール(structural_object_detection_trainer)を試してみる。 qiita.com 前準備 dlibのインストールに数回失敗(boostが入ってなかった) virtual…

スコア認識

やりたいこと リザルト画像からスコアを文字データとして取り出す。 画像の特徴 どうやら未だボルテはe-amu連携でスコア投稿する機能がないらしい。 → リザルトは全てユーザの撮影写真となるため、スコア表示部分位置や明るさ・画質等々がまちまち。 フォン…

趣味開発をすることにした

何をするのか 前々からアイデア自体はあったものの、何も手を動かさないまま大分経過してしまったサービスを勉強を兼ねて実装する。 勉強すること Ruby on Rails Python 画像認識 機械学習 AWS など いろいろ欲張りすぎてどれも中途半端になる予感はするが、…