2023-05-13发表2023-11-05更新人工智能 / 大模型19 分钟读完 (大约2887个字)

使用ChatGPT和StableDiffusion给Hexo文章添加封面图

最近想添加封面图，想尝试使用StableDiffusion的AIGC自动生成封面图。但是，国内chatGPT很容易被封，像DALL·E这种又没法注册，国内百度的文言一格等未开放API，所以只有使用开源大模型了。

类似github管理代码仓库一样，比较有名的管理开源大模型的网站主要有2个：

国外：huggingface
国内：ModelScope（阿里合作）

考虑到第一次使用，学习曲线需要比较平缓才好入门，我使用国内的ModelScope来做大模型HelloWorld。最终决定使用阿里达摩院提供的中文StableDiffusion-通用领域这个大模型进行生成。

2023-04-30发表2023-11-05更新人工智能 / 大模型20 分钟读完 (大约3045个字)

近期对chatGPT的理解

一、和之前“人工智障”的差异在哪里

1、能联系上下文，并不是一问一答，而是连续对话。

天猫精灵这类初代AI，只能做“天气如何”-“今天的天气是”，“今天几号”-“今天是”，这样一问一答的对话。但是一次问答通常只能“查询属性”、“执行命令”这种简单操作，人类的任务通常更复杂，需要分析对方答案并再次提出问题，直到双方观点对齐。chatGPT能够分析上下文，提供了连续问答的能力，所以现在有很多玩法是，让chatGPT扮演某个角色，然后以角色身份进行交互。

2、能够自我纠错，“你这里错了”，且具有主见，“我认为没有错”。

在连续对话的能力下，我们可以指出chatGPT答案中的错误，chatGPT会分析自己答案中的错误，并以更大的正确概率去修正答案。为什么通过指出错误能得到更正确的答案？目前的主流观点认为，这样做相当于把大任务划分为了小任务，单步拆解能给到更好的提示，辅助下一步的推理形成良性循环，因此最终大任务也具有更高的正确率了。

2019-01-07发表2023-11-05更新人工智能 / 图像分割13 分钟读完 (大约1908个字)

毕业设计整理（六）：LBP纹理特征

局部二值模式（Local Binary Pattern，LBP）是一种用来描述图像局部纹理特征的算法，反映的是图像像素点周围纹理变化情况，具有旋转不变性、灰度不变性（光照变化无影响）、计算复杂度低等优点，1994年首次由Timo Ojala, Matti Pietikainen等人提出，用于纹理特征提取。2002年论文《Multiresolution gray-scale and rotation invariant texture classification with local binary patterns》进行了归纳总结，2018年该论文引用量154次，累计9832次。

LBP特征描述

原始LBP特征

2019-01-06发表2023-11-05更新人工智能 / 图像分割10 分钟读完 (大约1458个字)

毕业论文整理（五）：Haar像素值特征

Haar特征是我用得最多的一个特征了。Haar特征的鲁棒性并不好，它常常用于颜色或者轮廓较为明显的、波动不大的图像，比如人脸识别中识别眼睛、鼻子的位置。尽管如此，用Haar特征处理一般图像分割已经足够使用了。

Haar特征设计思想

Haar特征(Haar-like Feature)的名称来源于Haar小波(Haar Wavelet)变换，最早由Papageorgiou在论文《A General Framework for Object Detection》中提出。那个时期，用RGB图像像素值来处理特征会产生很大的计算量，Papageorgiou等人就提出了用Haar小波变换来处理特征的想法。在2001年，Viola和Jones在论文《Rapid Object Detection using a Boosted Cascade of Simple Features》中基于这个想法进一步提出Haar特征，产生了很大的影响。他们注意到人的面部是可以用一些矩形特征进行描述的，比如对于浅色皮肤的人来说，鼻梁两侧的颜色比鼻梁的颜色要深一些，眼睛、嘴巴等地方的颜色都比周围面部皮肤的颜色要深。因此，可以用矩形像素变化来表现颜色深浅，这就是Haar特征的来源。

2019-01-02发表2023-11-05更新人工智能 / 图像分割18 分钟读完 (大约2700个字)

毕业论文整理（四）：彩色图像分割的颜色空间

颜色空间概述

入门彩色图像分割首先当然要了解一下颜色空间。

RGB颜色空间

RGB颜色空间的设计初衷是，用红色（Red）、蓝色（Blue）和绿色（Green）作为基础颜色，通过三基色的强弱变化组合成整个颜色空间中的各种颜色。

如上图所示，分别以红色、绿色、蓝色分量为R轴、G轴、B轴建立坐标系，原点(0, 0, 0)代表的颜色为黑色，(1, 0, 0)、(0, 1, 0)、(0, 0, 1)分别表示红色、蓝色、绿色，构成的立方体中体对角线端点(1, 1, 1)代表的颜色为白色，而体对角线上的颜色则是由黑色过渡到白色的灰度。至此，任意一种常见颜色都可以由(R, G, B)的坐标数值表示出来。

2019-01-01发表2023-11-05更新人工智能 / 图像分割19 分钟读完 (大约2877个字)

毕业论文整理（三）：AdaBoost和概率提升树

概率提升树

这是本科毕设用到的树，概率提升树（Probabilistic Boosting-Tree, PBT）是Tu在2005年《Probabilistic Boosting-Tree: Learning Discriminative Models for Classification, Recognition, and Clustering》中提到的分层分类框架。

2018-11-27发表2023-11-05更新人工智能 / 图像分割17 分钟读完 (大约2595个字)

毕业论文整理（二）：用依赖树近似离散概率分布

《Approximating Discrete Probability Distributions with Dependence Trees》是一篇1968年的经典论文了，即使在2018年也有28次的引用量：

2018-11-27发表2023-11-05更新人工智能 / 图像分割22 分钟读完 (大约3232个字)

毕业论文整理（一）：CT图像和邻域近似随机森林

课题要求

使用树模型分割彩色图像中的目标。

主要改进了邻域近似随机森林（Neighbourhood Approximation using Randomized Forests，NAFs），还使用了依赖树（Approximating Discrete Probability Distributions with Dependence Trees，CLT）。

邻域近似随机森林NAFs

NAFs的原论文是用于医学图像分割的，它是一个框架不是一个模型，主要作用是对任意距离定义的近似最近邻检索（approximate nearest neighbour retrieval for arbitrary distances），解决的问题类似于：给定一组带Ground Truth的灰度人体侧面CT图片去训练NAFs，然后对于一幅新的CT图片（out of samples），给出CT图像中各个内脏边缘的3D分割结果。

使用ChatGPT和StableDiffusion给Hexo文章添加封面图

近期对chatGPT的理解

一、和之前“人工智障”的差异在哪里

1、能联系上下文，并不是一问一答，而是连续对话。

2、能够自我纠错，“你这里错了”，且具有主见，“我认为没有错”。

毕业设计整理（六）：LBP纹理特征

LBP特征描述

原始LBP特征

毕业论文整理（五）：Haar像素值特征

Haar特征设计思想

毕业论文整理（四）：彩色图像分割的颜色空间

颜色空间概述

RGB颜色空间

毕业论文整理（三）：AdaBoost和概率提升树

概率提升树

毕业论文整理（二）：用依赖树近似离散概率分布

毕业论文整理（一）：CT图像和邻域近似随机森林

课题要求

邻域近似随机森林NAFs

链接

分类

最新文章

归档

标签