opencv介绍（opencv的使用方法）

by intanet.cn ca 人工智能 on 2024-03-20

本篇文章给大家谈谈opencv介绍，以及opencv的使用方法对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。

本文目录一览：

1、openCV进阶之二：自动校准扫描图像生成鸟瞰图
2、opencv docs适用于
3、OpenCV (一)Mat基本操作以及灰度图转化
4、下面分别是OpenCV中的什么库?具体干什么用的啊?介绍下谢谢。

openCV进阶之二：自动校准扫描图像生成鸟瞰图

上一节介绍了如何openCV的透视转换方法的应用，并构建了一个基于给定四角点转换鸟瞰图的方法函数，这一节将继续这个运用，通过查找边缘的方法实现自动转换的功能。

实现步骤实际上很简单，只需要三步：

第一步：查找文档的边缘

第二步：通过边缘查找文档轮廓并找到四个角点的坐标

第三步：使用透视转换函数完成图像转换

下面的代码基于openCV/python的版本：openCV2.4/3+, python2.7/3+

上一章节我们完成了transform.py模块的构建，我们将在接下来的涉及图像四角点处理的问题中均会使用到。打开你的python编辑器，创建一个新的文档，蚂宴并命名为scan.py。

接下来就是第一步：边缘查找：

测试一下效果：

shell

虽然背景有点不干净但是文档的边缘还是很明显的，接下来我们想办法查找文档的边缘并生成轮廓。

第二步：寻找轮廓：

事实上，在构建文档扫描器时，有一个非常重要的前提：扫描仪只是在一张纸上扫描。一张纸被假定为长方形，矩形有四条边。因此，我们可以创建一个简单的方法来帮助我们构建文档扫描器。我们假设图像中最大的轮廓恰好有四个点，这就是我们要扫描的那张纸。这也是一个相当安全的假设——当然，也可以人为的给定文档轮廓。

运行一下代码测试效果：shell中输入

正如您所看到的，我们已经成功地利用边缘检测图像找到了文档的轮廓(outline)，我的收据周围的绿色矩形显示了轮廓(outline)。最后，让我们进入步骤3，这将是用到four_point_transform函数。

第三步：转换图像：构建移动文档扫描器的最后一步是取代表文档大纲的四个点，并应用透视图转换来获得自顶向下的图像“鸟瞰图”。

我们将把两个参数传递给four_point_transform:第一个参数是我们从磁盘加载的原始图像(不是调整大小的图像)，第二个参数是表示文档的轮廓线，乘以调整大小闷早银的比例。

你可能会想，为什么要乘以调整后的比例? 我们乘以调整后的比例，因为我们进行了边缘检测，在调整后的高度=500像素的图像上发现了轮廓。但是，我们希望对原始图像进行扫描，而不是对调整大小的图像进行扫描，因此我们将轮廓点乘以调整大小的比例。

为了获得图像的黑白感觉，我们将扭曲后的图像转换为灰度图像，并应用自适应阈值。

好的，我们来运行一下效果：

shell

好了，到目前为止，扫描图像到文档提取鸟瞰图的过程实现完成了。遗留问题：

实际上这个程序还有不少地方需要你的改进，比如要求转换的文档本身是规则的四边形，拍摄时尽量放在对比度明显的桌面背景，这样做的目的是为了避免边缘查找时出现多于四边的情况，多于四边的边缘后续轮廓查找会出现问题。也就是找不到合适的四边轮廓来匹配。

解决方案：可睁孝以采用人工标注四个角点的方式来提取轮廓更为可靠。因为在实际应用场景往往是不规则的文档。下一节我们来探讨这个方案实现过程。

opencv docs适用于

适用于快速下载技术文档。

opencv介绍OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、闹正MATLAB等语言的接口，实现了图像处理和计绝弯猛算机视觉方面的很多通用算法。

OpenCV用C++语言编写，它的主要接口并桥也是C++语言，但是依然保留了大量的C语言接口。

该库也有大量的Python、JavaandMATLAB/OCTAVE（版本2、5）的接口。这些语言的API接口函数可以通过在线文档获得。如今也提供对于C#、Ch、Ruby，GO的支持。所有新的开发和算法都是用C++接口。

OpenCV (一)Mat基本操作以及灰度图转化

开始写OpenCV这篇文章的时候，不由想到，我的大学计算机图形学的第一门实操课程就是灰度转化，拉普拉斯锐化等。其中灰度图的转化，是计算机图形学基础中基础，这里就顺着OpenCV的灰度的转化，来看看OpenCV一些基础的api。

本文地址：

先来看看OpenCV，基础对象Mat，矩阵。什么是矩阵，实际上没有必要解释，一般人都能够明白数学意义上矩阵的含义。

OpenCV把每一个M * N的宽高图像，看成M*N的矩阵。矩阵的每一个单元就对应着图像中像素的每一个点。

我们如果放大图中某个部分，就会发现如下情况

图像实际上就如同矩阵一样每个单元由一个像素点构成。

因为OpenCV的Mat每一个像素点，包含的数据不仅仅只有一个单纯的数字。每一个像素点中包含着颜色通道数据。

稍微解释一下颜色通道，我们可以把世间万物肉眼能识别的颜色由3种颜色(R 红色，G 绿色，B 蓝色)经过调节其色彩饱和度组成的。也就是说通过控制RGB三种的色值大小(0~255)来调配新的颜色。

当我们常见的灰度图，一般是单个颜色通道，因为只用黑白两种颜色。我们常见的图片，至少是三色通道，因为需要RGB三种颜色通道。

我们常见Android的Bitmap能够设置ARGB_8888的标志位就是指能够通过A(透明通道),R,G,B来控制图片加载的颜色通道。

OpenCV为了更好的控制这些数据。因此采用了数学上的矩阵的概念。当OpenCV要控制如RGB三色通道的Mat，本质上是一个M * N * 3的三维矩阵。

但是实际上，我们在使用OpenCV的Mat的时候，我们只需要关注每个樱弊图片的像素，而每个像素的颜色通道则是看成Mat中每个单元数据的内容即可

我们先来看看Mat的构造方法

现阶段，实际上我们值得我们注意的是构造函数：

举个例子：

这个mat矩阵将会制造一个高20，宽30，一个1字节的颜色通道(也是Mat中每一个像素数据都是1字节的unchar类型的数据)，同时颜色是白色的图片。

在这里面我们能够看到一个特殊的宏CV_8UC1。实际上这是指代OpenCV中图片带的是多少颜色通道的意思。

这4个宏十分重要，要时刻记住。

当我们需要把Mat 中的数配棚据拷贝一份出来，我们应该调用下面这个api：

这样就能拷贝一份像素数据到新的Mat中。之后操作新的Mat就不会影响原图。

实际上，在本文中，我们能够看到OpenCV是这么调用api读取图片的数据转化为Mat矩阵。

OpenCV会通过imread去读图片文件，并且转化为Mat矩阵。

能看见imread，是调用imread_把图片中的数据拷贝的img这个Mat对象中。接着会做一次图片的颠倒。这个方面倒是和Glide很相似。

文件：modules/imgcodecs/src/loadsave.cpp

这里面做了几个事情，实际上和FFmpge的设计十分相似。

其核心也是操作Mat中的像素指针，找到颜色通道，确定指针移动的步长，赋值图片的数据到Mat矩阵中。核心如下：

其中还涉及到jpeg的哈夫曼算法之类的东西，这里就不深入源码。毕竟这是基础学习。

什么是灰度图，灰度度图实际上我们经常见到那些灰白的也可以纳入灰度图的范畴。实际上在计算机图形学有这么一个公式：

将RGB的多颜色图，通过的算法，将每一个像素的图像的三颜色通道全部转化为为一种色彩，通过上面的公式转为为一种灰色的颜色。

一旦培颂则了解了，我们可以尝试编写灰度图的转化。我们通过矩阵的at方法访问每一个像素中的数据。

为了形象表示矩阵指针，指向问题，可以把RGB在OpenCV的Mat看成如下分布:

记住OpenCV的RGB的顺序和Android的不一样，是BGRA的顺序。和我们Android开发颠倒过来。

因此，我们可以得到如下的例子

我们经过尝试之后，确实能够把一个彩色的图片转化一个灰色图片。但是这就是

这里介绍一下Mat的一个api：

实际上OpenCV，内置了一些操作，可以把RGB的图像数据转化灰度图。

我们看看OpenCV实际上的转化出来的灰度图大小。我们通过自己写的方法，转化出来的灰度图是119kb，而通过cvtColor转化出来的是44kb。

问题出在哪里？还记得吗？因为只有灰白两种颜色，实际上只需要一种颜色通道即可，而这边还保留了3个颜色通道，也就说图片的每一个像素点中的数据出现了没必要的冗余。

这样就是44kb的大小。把三颜色通道的数据都设置到单颜色通道之后，就能进一步缩小其大小。

实际上在Android中的ColorMatrix中也有灰度图转化的api。

对画笔矩阵进行一次，矩阵变化操作。

实际上就是做了一次矩阵运算。绘制灰度的时候相当于构建了这么一个矩阵

接着通过矩阵之间的相乘，每一行的 0.213f,0.715f,0.072f控制像素的每个通道的色值。

对于Java来说，灰度转化的算法是：，把绿色通道的比例调大了。

在OpenCV中有这么两个API，add和addWidget。两者都是可以把图像混合起来。

add和addWidget都是将像素合并起来。但是由于是像素直接相加的，所以容易造成像素接近255，让整个像素泛白。

而权重addWeighted，稍微能减轻一点这种问题，本质上还是像素相加，因此打水印一般不是使用这种办法。

等价于

saturate_cast这个是为了保证计算的值在0～255之间，防止越界。

饱和度，图片中色值更加大,如红色，淡红，鲜红

对比度：是指图像灰度反差。相当于图像中最暗和最亮的对比

亮度：暗亮度

控制对比度，饱和度的公式： , ,

因此当我们想要控制三通道的饱和度时候，可以通过alpha来控制色值成比例增加，beta控制一个色值线性增加。

如下：

在这里，看到了OpenCV会把所有的图片看成Mat矩阵。从本文中，能看到Mat的像素操作可以能看到有两种，一种是ptr像素指针，一种是at。ptr是OpenCV推荐的更加效率的访问速度。

当然还有一种LUT的核心函数，用来极速访问Mat矩阵中的像素。其原理是对着原来的色值进行预先的变换对应(设置一个颜色通道)。用来应对设置阈值等情况。

下面分别是OpenCV中的什么库?具体干什么用的啊?介绍下谢谢。

246表示OpenCV的版本为2.4.6，版本后有d表示debug版本，没d表示release版本

opencv_core246d.lib是核心功能模块库，提供了OpenCV的基本数困旅据结构和基本函数

opencv_highgui246.lib是高层图形用户界面库，提供图形用户界面接口

opencv_features2d246.lib是2D功能框架库，提供了特征检测和描述相关功能

opencv_ml246.lib是机器学习库，提供了一些统计模型和分渗尺派类算法

OpenCV每个部分是很深奥的，有兴趣推荐看看《学习OpenCV》这本书丛贺，里面有对每个部分进行较为详细的介绍

[img]

关于opencv介绍和opencv的使用方法的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

linux新建用户（linux新建用户密码） jenkinswindows（jenkinswindows下的脚本）

opencv介绍（opencv的使用方法）

openCV进阶之二：自动校准扫描图像生成鸟瞰图

opencv docs适用于

OpenCV (一)Mat基本操作以及灰度图转化

下面分别是OpenCV中的什么库?具体干什么用的啊?介绍下谢谢。

最近发表

文章归档

标签列表

opencv介绍（opencv的使用方法）

openCV进阶之二：自动校准扫描图像生成鸟瞰图

opencv docs适用于

OpenCV (一)Mat基本操作以及灰度图转化

下面分别是OpenCV中的什么库?具体干什么用的啊?介绍下谢谢。

相关阅读

明星人脸识别（明星人脸识别照片泄露）

085410人工智能专业（人工智能专业大学排名考研）

数据科学和人工智能（数据科学和人工智能哪个火）

智能推荐算法有哪些（智能推荐的经典算法主要有两种）

人机交互实例（人机交互应用实例）

是人工智能技术应用最为广泛的领域（是人工智能技术应用最为广泛的领域a机器人b芯片c软件）

最近发表

文章归档

标签列表