使用ChatGPT和StableDiffusion给Hexo文章添加封面图

最近想添加封面图,想尝试使用StableDiffusion的AIGC自动生成封面图。但是,国内chatGPT很容易被封,像DALL·E这种又没法注册,国内百度的文言一格等未开放API,所以只有使用开源大模型了。

类似github管理代码仓库一样,比较有名的管理开源大模型的网站主要有2个:

考虑到第一次使用,学习曲线需要比较平缓才好入门,我使用国内的ModelScope来做大模型HelloWorld。最终决定使用阿里达摩院提供的中文StableDiffusion-通用领域这个大模型进行生成。

阅读更多

近期对chatGPT的理解

一、和之前“人工智障”的差异在哪里

1、能联系上下文,并不是一问一答,而是连续对话。

天猫精灵这类初代AI,只能做“天气如何”-“今天的天气是”,“今天几号”-“今天是”,这样一问一答的对话。但是一次问答通常只能“查询属性”、“执行命令”这种简单操作,人类的任务通常更复杂,需要分析对方答案并再次提出问题,直到双方观点对齐。chatGPT能够分析上下文,提供了连续问答的能力,所以现在有很多玩法是,让chatGPT扮演某个角色,然后以角色身份进行交互。

2、能够自我纠错,“你这里错了”,且具有主见,“我认为没有错”。

在连续对话的能力下,我们可以指出chatGPT答案中的错误,chatGPT会分析自己答案中的错误,并以更大的正确概率去修正答案。为什么通过指出错误能得到更正确的答案?目前的主流观点认为,这样做相当于把大任务划分为了小任务,单步拆解能给到更好的提示,辅助下一步的推理形成良性循环,因此最终大任务也具有更高的正确率了。

阅读更多

毕业设计整理(六):LBP纹理特征

局部二值模式(Local Binary Pattern,LBP)是一种用来描述图像局部纹理特征的算法,反映的是图像像素点周围纹理变化情况,具有旋转不变性、灰度不变性(光照变化无影响)、计算复杂度低等优点,1994年首次由Timo Ojala, Matti Pietikainen等人提出,用于纹理特征提取。2002年论文《Multiresolution gray-scale and rotation invariant texture classification with local binary patterns》进行了归纳总结,2018年该论文引用量154次,累计9832次。

LBP特征描述

原始LBP特征

origin_lbp.png

阅读更多

毕业论文整理(五):Haar像素值特征

Haar特征是我用得最多的一个特征了。Haar特征的鲁棒性并不好,它常常用于颜色或者轮廓较为明显的、波动不大的图像,比如人脸识别中识别眼睛、鼻子的位置。尽管如此,用Haar特征处理一般图像分割已经足够使用了。

Haar特征设计思想

Haar特征(Haar-like Feature)的名称来源于Haar小波(Haar Wavelet)变换,最早由Papageorgiou在论文《A General Framework for Object Detection》中提出。那个时期,用RGB图像像素值来处理特征会产生很大的计算量,Papageorgiou等人就提出了用Haar小波变换来处理特征的想法。在2001年,Viola和Jones在论文《Rapid Object Detection using a Boosted Cascade of Simple Features》中基于这个想法进一步提出Haar特征,产生了很大的影响。他们注意到人的面部是可以用一些矩形特征进行描述的,比如对于浅色皮肤的人来说,鼻梁两侧的颜色比鼻梁的颜色要深一些,眼睛、嘴巴等地方的颜色都比周围面部皮肤的颜色要深。因此,可以用矩形像素变化来表现颜色深浅,这就是Haar特征的来源。

阅读更多

毕业论文整理(四):彩色图像分割的颜色空间

颜色空间概述

入门彩色图像分割首先当然要了解一下颜色空间。

RGB颜色空间

RGB颜色空间的设计初衷是,用红色(Red)、蓝色(Blue)和绿色(Green)作为基础颜色,通过三基色的强弱变化组合成整个颜色空间中的各种颜色。

rgb.png
如上图所示,分别以红色、绿色、蓝色分量为R轴、G轴、B轴建立坐标系,原点(0, 0, 0)代表的颜色为黑色,(1, 0, 0)、(0, 1, 0)、(0, 0, 1)分别表示红色、蓝色、绿色,构成的立方体中体对角线端点(1, 1, 1)代表的颜色为白色,而体对角线上的颜色则是由黑色过渡到白色的灰度。至此,任意一种常见颜色都可以由(R, G, B)的坐标数值表示出来。

阅读更多

毕业论文整理(一):CT图像和邻域近似随机森林

课题要求

使用树模型分割彩色图像中的目标。

主要改进了邻域近似随机森林(Neighbourhood Approximation using Randomized Forests,NAFs),还使用了依赖树(Approximating Discrete Probability Distributions with Dependence Trees,CLT)。

邻域近似随机森林NAFs

NAFs的原论文是用于医学图像分割的,它是一个框架不是一个模型,主要作用是对任意距离定义的近似最近邻检索(approximate nearest neighbour retrieval for arbitrary distances),解决的问题类似于:给定一组带Ground Truth的灰度人体侧面CT图片去训练NAFs,然后对于一幅新的CT图片(out of samples),给出CT图像中各个内脏边缘的3D分割结果。

阅读更多