import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread('/data/cvdata/digits.png')
gray = cv.cvtColor(img,cv.COLOR_BGR2GRAY)

cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)]

x = np.array(cells)

train = x[:,:50].reshape(-1,400).astype(np.float32) # Size = (2500,400)
test = x[:,50:100].reshape(-1,400).astype(np.float32) # Size = (2500,400)

k = np.arange(10)
train_labels = np.repeat(k,250)[:,np.newaxis]
test_labels = train_labels.copy()

knn = cv.ml.KNearest_create()
knn.train(train, cv.ml.ROW_SAMPLE, train_labels)
ret,result,neighbours,dist = knn.findNearest(test,k=5)

matches = result==test_labels
correct = np.count_nonzero(matches)
accuracy = correct*100.0/result.size
print( accuracy )

91.76

np.savez('xx_knn_data.npz',train=train, train_labels=train_labels)

with np.load('xx_knn_data.npz') as data:
    print( data.files )
    train = data['train']
    train_labels = data['train_labels']

['train', 'train_labels']

import cv2 as cv
import numpy as np

data= np.loadtxt('/data/cvdata/letter-recognition.data',
                 dtype= 'float32', 
                 delimiter = ',',
                 converters= {0: lambda ch: ord(ch)-ord('A')})

train, test = np.vsplit(data,2)

responses, trainData = np.hsplit(train,[1])
labels, testData = np.hsplit(test,[1])

knn = cv.ml.KNearest_create()
knn.train(trainData, cv.ml.ROW_SAMPLE, responses)
ret, result, neighbours, dist = knn.findNearest(testData, k=5)
correct = np.count_nonzero(result == labels)
accuracy = correct*100.0/10000
print( accuracy )

93.06

手写数字 OCR

英文字母OCR

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

手写数字 OCR

英文字母OCR

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R 编程语言

Julia编程语言

介绍

平台内核

注意事项