![视觉大数据智能分析算法实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/579/47216579/b_47216579.jpg)
上QQ阅读APP看书,第一时间看更新
1.2 答题卡预处理
本案例选择某实际考试的答题复印/扫描图作为实验对象,重点对选择题的答题区域做图像增强处理,提高目标内容的对比度。
如图1-1所示,答题区域集中在试卷头部的网格区域,并且呈现黑白文字图的特点,因此我们可以采用基本的图像灰度化、图像二值化及图像反色来进行预处理,提高区域对比度,关键代码如下所示。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P22_3432.jpg?sign=1739341637-6B62DnvcOW584NbIPJHFzCr1Fcy8Yq9b-0-0e228d1fc29d5dbfdcd841d16302eed7)
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P23_3436.jpg?sign=1739341637-3fJvHDq3sjsKQsHpg0C9i3xqJcxU8zVc-0-bc8f46ec331c3b20815a1f5d1587593c)
图1-1 答题卡图像示例
程序首先通过imread用于读取指定路径的图像得到数字图像矩阵,rgb2gray用于将RGB图转换为灰度图矩阵;然后通过graythresh用于计算灰度图的otsu阈值,im2bw用于进行二值化变换并反色;最后采用形态学水平闭合操作突出答题区域并通过bwareafilt提取最大面积的连通区域,经imwrite函数写到指定的图像文件。运行后,得到的结果如图1-2所示。
如图1-2所示,通过预处理得到了对比度增强的二值化图,突出了答案区域的文本内容,可以发现答案区域呈现出了网格划分、数字题号、字母答案的特点,并且每个题的答案是单选的A、B、C、D之一,可考虑通过图像分割及模板匹配等方案进行答案定位及识别。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P24_4659.jpg?sign=1739341637-eEEKLGs9QAlTLEtDpVt5PJUldvqlAViV-0-32f4ff923b0c893ab6150f82b9fb3b87)
图1-2 答题卡图像预处理