目录
题目描述基本思路核心代码题目描述
目录hw1下的图像是一些胶片的照片,请将其进行度量矫正。
推荐流程:采用Canny算子,检测边缘点;采用Hough直线检测,根据边缘点检测胶片边缘对应的4条直线;4条直线在图像平面中的交点为胶片图像的4个顶点。根据4个顶点与真实世界中胶片的位置(假设胶片图像长宽比为4:3),得到两个平面之间的单应变换矩阵,并根据单应变换矩阵实现图像矫正。
(资料图)
基本思路
使用Canny算子,检测边缘点;以边缘点作为输入,采用Hough直线检测,检测出最多点共线的四条直线,这四条直线的交点就是照片中屏幕的四个顶点;假设胶片图像长宽比为4:3,那么此时已知四个匹配的点,可以求解出两个平面之间的单应变换矩阵;从而可以使用原图像、单应变换矩阵,对原图像进行变换,即可实现图像矫正。实现日志
Canny边缘检测:PythonOpenCVCanny边缘检测算法的原理实现详解
Hough直线检测:PythonOpenCVHough直线检测算法的原理实现
在具体实现时,发现对于给定的图像,几乎不可能通过调整阈值的方式,使得Hough检测到的直线刚好是屏幕边框。经过多轮调整,在下界为180、上界为260时取得了较为理想的结果,
如下图所示:
对于三张图像,经过实验,最终选择的最佳阈值为:
correct("images/1.jpeg", 180, 260) correct("images/2.jpeg", 30, 100) correct("images/3.jpeg", 100, 160)
但即便是最佳阈值,也无法做到仅检测出四条线。思考过后,决定加入一步人工筛选。
有两种可行的技术方案:
人工筛选直线人工筛选交点考虑到如果筛选交点的话,工作量明显比筛选直线更大,所以选择人工筛选直线。后面有时间的话考虑加入图形化界面,目前因时间原因,选择专注于算法本身,暂不考虑可视化编程。
直接显示出下图用于筛选:
这里符合条件的直线id为2、3、6、7。
求解得到的交点:
我们假设目标图像是4:3的,也就是其大小为(800, 600),从而我们可以确定目标图像中四个关键点位置为[0, 0], [800, 0], [0, 600], [800, 600]。为了保证交点与目标点一一对应,最为高效的解决方案是,我们筛选图像的时候,按照上、左、下、右的顺序即可。
核心代码
def correct(image_path, threshold1, threshold2): # 读取图像并转换为灰度图像 image = cv2.imread(image_path) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 使用Canny算子检测边缘 edges = canny_detect(gray, threshold1, threshold2, show=False) # 使用Hough检测直线 lines = hough_detect(image, edges, show=False) # 手动筛选 for id, line in enumerate(lines): rho, theta = line[0] x1, y1, x2, y2 = convert_polar_to_two_points(rho, theta) temp_image = image.copy() cv2.line(temp_image, (x1, y1), (x2, y2), (255, 0, 0), 7) plt.subplot(5, 5, id + 1) plt.imshow(temp_image) plt.title("{}".format(id)) plt.xticks([]) plt.yticks([]) plt.show() choose = input("请输入您选择的直线的id,以空格分隔:").split(" ") # 求解交点 crossover_points = [] assert len(choose) == 4 for i in range(4): for j in range(i+1, 4): rho1, theta1 = lines[int(choose[i])][0] rho2, theta2 = lines[int(choose[j])][0] # 如果角度差太小,认为它们是平行线 if abs(theta2 - theta1) > np.pi / 8 and abs(theta2 - theta1) < np.pi * 7 / 8: crossover_points.append(cal_crossover(rho1, theta1, rho2, theta2)) # 确定变换前后的坐标 before = np.float32(crossover_points) after = np.float32([[0, 0], [800, 0], [0, 600], [800, 600]]) # 单应变换 h = cv2.getPerspectiveTransform(before, after) result = cv2.warpPerspective(image, h, (800, 600)) cv2.imwrite(image_path.split(".")[0] + "_correct.jpeg", result) return result
矫正结果:
到此这篇关于Python OpenCV 图像矫正的原理实现的文章就介绍到这了,更多相关Python OpenCV 图像矫正内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 2充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 3好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 4名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 5亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战
- 6京东绿色建材线上平台上线 新增用户70%来自下沉市场
- 7网红淘品牌“七格格”chuu在北京又开一家店 潮人新宠chuu能红多久
- 8市场竞争加剧,有车企因经营不善出现破产、退网、退市
- 9北京市市场监管局为企业纾困减负保护经济韧性
- 10市场监管总局发布限制商品过度包装标准和第1号修改单