python实现RGB与YCBCR颜色空间转换
目录
- 前言:
- 1、灰度值和亮度的关系
- 2、RGB颜色空间与颜色控制
- 3、YCbCr颜色空间及与RGB的变换关系
前言:
人类如何感知或者理解颜色是个非常复杂的问题,本文不讨论如何从生物学或者心理学角度来分析颜色,而是分析“数值大小如何影响颜色”。文中主要介绍了RGB与YCbCr颜色空间概念的与变换关系。
1、灰度值和亮度的关系
人类能够从灰度图像中获取理解场景需要的大部分信息,所以看黑白电视机并不会严重影响人对视频中场景的理解。图像的亮度和像素值成正比,如果需要增加图像的亮度,比如从黑色逐渐过渡到白色,就可以对单通道的灰度图像素值进行增加来实现。保存灰度图像的每个像素值一般采用8个bit,像素值的范围为0-255。
下面的例子展示了灰度图像的像素值增加时亮度的变化过程,假设图像初始像素值为0:
上面显示了lena图像像素值增加时肤色的变化。代码的实现比较简单,读取图片,然后不断的对图像的每个像素值增加偏移量:
import numpy as np import matplotlib.pyplot as plt import imageio image = imageio.imread("lena.jpg") # 设置每次循环像素的增加量 shift = 6*np.ones(shape=(64, 64)) plt.figure() for i in range(1, 17): plt.subplot(4, 4, i) plt.imshow(image/255, cmap="gray", vmin=0, vmax=1) plt.axis("off") image = image + shift
2、RGB颜色空间与颜色控制
RGB模型在硬件设备中被广泛的使用,通过R(红色)、G(绿色)、B(蓝色)三者进行叠加可以形成更多的颜色。RGB颜色空间和后面将要进行介绍的YCbCr颜色空间和HSV颜色空间存在线性的变换关系,所以只要拥有RGB图像就能得到其它颜色空间的图像。
一幅图像中R、G、B分别作为三个通道,如果某两个通道的值为0,图像的颜色就会被不为零的那个通道控制。
比如:
实现上面的效果需要三个步骤:
- (1)创建一幅3通道的空图像
- (2)给3通道空图像的R通道添加一幅单通道图像
- (3)给3通道图像的R通道像素值不断增加偏移量
# 1:创建一幅3通道的空图像 = np.zeros(shape=(64, 64, 3)) r = imageio.imread("lena.jpg")/2 # 2:给3通道空图像的R通道添加一幅单通道图像 image[:, :, 0] = image[:, :, 0] + r shift = 4*np.ones(shape=(64, 64)) plt.figure() for i in range(1, 17): plt.subplot(4, 4, i) plt.imshow(image/255, vmin=0, vmax=1) plt.axis("off") # (3)给3通道图像的R通道像素值不断增加偏移量 image[:, :, 0] = image[:, :, 0] http://www.cppcns.com+ shift
但是,由于最终图像呈现出的颜色是三R\G\B三者的叠加,而现实中不仅仅是其中之一的颜色,所以很难控制最终图像的颜色,所以我们需要其它的颜色空间。
3、YCbCr颜色空间及与RGB的变换关系
YCbCr颜色空间中的Y是亮度通道,Cb是蓝色分量,Cr是红色分量。它在电视系统中比较常用,比如早期的黑白电视机使用彩色电视信号线,就可以单独使用亮度值;这种功能RGB颜色空间就做不到,因为我们不能仅仅使用RGB中某个通道作为亮度信号来使用。
由于YCbCr经常和YUV颜色空间比较相似,所以二者容易被认为是从属或者等价关系,按照维基百科的说法:YUV 是模拟信号,而YCbCr是数字信号。
YCbCr和RGB存在线性的变换关系,本文介绍的变换矩阵来自ITU.BT-601,所规定的变换矩阵Trans形式如下:
实现rgb2ycbcr()函数只需要两个步骤:(1)创建变换矩阵Trans;(2)遍历图像每个像素点,并对三个通道分别进行矩阵计算。
下面的代码展示了如何实现从RGB空间到YCBCR变换:
def rgb2ycbcr(rgbwww.cppcns.com_image): """convert rgb into ycbcr""" if len(rgb_image.shape)!=3 or rgb_image.shape[2]!=3: raise ValueError("input image is not a rgb image") rgb_image = rgb_image.astype(np.float32) # 1:创建变换矩阵,和偏移量 transform_matrix = np.array([[0.257, 0.564, 0.098], [-0.148, -0.291, 0.439], [0.439, -0.368, -0.071]]) shift_matrix = np.array([16, 128, 128]) ycbcr_image = np.zeros(shape=rgb_image.shape) w, h, _ = rgb_image.shape # 2:遍历每个像素点的三个通道进行变换 for i in range(w): for j in range(h): ycbcr_image[i, j, :] = np.dot(transform_matrix, rgb_image[i, j, :]) + shift_matrix return ycbcr_image
如果想要求逆变换,只需要根据矩阵求逆法则进行就可以了,需要注意的是:逆变换时偏移矩阵也需要左乘变换矩阵Trans的逆!逆变换只需要将rgb2ycbcr
中的transform_matrix
求逆即可,再次强调:shift_matrix也需要乘以transform_matrix的逆,而不是直接减去shift_matrix!
def ycbcr2rgb(ycbcr_image): """convert ycbcr into rgb""" if len(ycbcr_image.shape)!=3 or ycbcr_image.shape[2]!=3: raise ValueError("input image is not a rgb image") ycbcr_image = ycbcr_image.astype(np.float32) transform_matrix = np.array([[0.257, 0.564, 0.098], [-0.148, -0.291, 0.439], [0.439, -0.368, -0.071]]) transform_matrix_inv = np.linalg.inv(transform_matrix) shift_matrix = np.array([16, 128, 128]) rgb_image = np.zeros(shape=ycbcr_image.shape) w, h, _ = ycbcr_image.shape for i in range(w): for j in range(h): rgb编程客栈_image[i, j, :] = np.dot(transform_matrix_inv, ycbcr_image[i, j, :]) - np.dot(transform_matrix_inv, shift_matrix) return rgb_image.astype(np.uint8)
所需要的包以及绘图代码如下,绘图用到的就是上面定义的两个函数。首先将rgb转为ycbcr,在从ycbcr转为rgb:
import numpy as np import imageiwww.cppcns.como import matplotlib.pyplot as plt rgb_image = imageio.imread("lena.jpg") ycbcr_image = rgb2ycbcr(rgb_image) cycle_image = ycbcr2rgb(ycbcr_image) images = [rgb_image, ycbcr_image, cycle_image] titles = ["orignal", "ycbcr", "cycle"] for i in range(1, len(images)+1): p编程客栈lt.subplot(1, 3, i) plt.title(titles[i-1]) plt.imshow(images[i-1]/255)
下图中左边是原始的rgb图像,中间是转换得到的ycbcr空间图像,右边是再次转回rgb空间的图像:
最后,对比了opencv提供的标准库的转换效果:
import cv2 rgb_image = imageio.imread("lena.jpg") ycrcb_image = cv2.cvtColor(rgb_image, cv2.COLOR_RGB2YCR_CB) cycle_image = cv2.cvtColor(ycbcr_image, cv2.COLOR_YCR_CB2RGB) images = [rgb_image, ycrcb_image, cycle_image] titles = ["orignal", "ycrcb", "cycle"] for i in range(1, len(images)+1): plt.subplot(1, 3, i) plt.title(titles[i-1]) plt.imshow(images[i-1]/255)
opencv得到的结果如下:
原始rgb效果和cycle(重构)效果很接近,而中间结果不一致是因为opencv采用的是“ycrcb”,而不是“ycbcr”。
到此这篇关于python实现RGB与YCBCR颜色空间转换的文章就介绍到这了,更多相关python颜色空间转换内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
精彩评论