2025-02-18发表2025-02-18更新计算机 / 机器学习和人工智能16 分钟读完 (大约2377个字)

利用大模型给项目起有趣的名字

DeepSeek的开源，可以预见国内高质量大模型资源将会越来越容易获得。“如何利用大模型来获取价值”会成为变现的方法。最近我发现了一个非常有前景的应用点——“给项目取有趣的名字”。

给项目起个有趣的名字！

给项目取个有趣的名字，会让开发变得更有乐趣。比如之前遇到过的一些项目：

社交游戏搭建平台：Disney 参考的就是迪士尼乐园
APP首页搭建平台：Domino 参考的就是多米诺积木
接口调用攻击防范平台：霸下参考的就是中国古代传说中参与大禹治水的神兽“霸下”，代表着力量和稳定
IT远程访问控制系统：南天门参考的就是天庭的入口“南天门”
群告警机器人：用水浒传的108将的诨名

这会比”PlayStation”、”xxxPlatform”、”xxxManagement”这种名字来得有趣得多。但一个与项目有关联的好名字并不容易想到，需要大量的文化知识以及丰富的联想能力。这种事情交给大模型就非常合适。

2024-11-03发表2024-11-03更新计算机 / 源码和原理41 分钟读完 (大约6164个字)

JDK21虚拟线程

虚拟线程是JDK21最重要的、可能会成为JDK8的lambda这样标志性的特性。这里对虚拟线程做原理级别的系统性分析。

虚拟线程的设计动机

对于后台服务器开发，一个请求对应一条处理线程，是最容易理解的服务器应用编程思路。但是，线程的数量会受到物理资源限制：比如默认Java线程会占用1MB内存，就会受到物理内存大小的限制；比如线程切换涉及内核态-用户态转换，需要频繁保存上下文，浪费CPU时间进行数据复制，受到CPU和带宽的限制。在海量请求到达时，线程资源会很快耗尽，成为主要的性能瓶颈。

早期的一个通常解法是：提高线程的利用率。一方面利用池化技术，减少线程创建销毁的开销，多余任务排队执行减少线程的数量；另一方面利用异步编程API（比如Future），在等待I/O时让出资源。但这样的后果是，一个请求的处理逻辑会被切分成很多段，执行-阻塞-回调-执行-阻塞-回调……这些段可能运行在不同的线程上，导致代码理解困难、调试困难。即使利用JDK8的CompletableFuture对并发编程逻辑做了编排，也只是治标而已。

而解决“线程数量限制”、“线程切换开销大”等问题的一个常用方案，就是构建用户态运行的“协程”。因此，Project Loom项目发起和推进Java的并发编程模型优化，其愿景为“write sync run async”，即“写同步代码，跑异步逻辑”。Loom提出了“纤程（Fiber）“的概念，并认为“纤程”由“续体（Continuation）”和“调度器（Scheduler）”两部分组成。而“纤程”在提供给用户的操作入口，称为“虚拟线程（Virtual Thread）”。“虚拟线程”资源几乎是无限的，每个请求都可以使用一个“虚拟线程”来执行业务逻辑。

2024-09-21发表2024-09-21更新兴趣 / 脑力游戏19 分钟读完 (大约2879个字)

尼姆博弈游戏

《十天后回到现实》：黑色大楼

很爱看一些有脑力游戏设计的大逃杀作品，最近的一个新综艺《十天后回到现实》，其中有一个关卡“【脑力7】黑色大楼”很有意思，本质上是改编小时候玩过的“谁先数到20”的游戏，这个游戏的来源是“尼姆博弈游戏”，来分析一下。

游戏描述

大楼从7层开始到14层，每层分别有8、7、6、……、1个房间亮灯，共36盏灯。闯关者和关主轮流关灯，每次只能关一层的灯，最少1盏，最多全部。游戏获胜条件是：关掉14楼的最后1盏灯获胜（通往14楼的楼梯在其余楼层灯关闭完成之前不开放）。本质上这是一个尼姆博弈游戏。

2024-08-15发表2024-08-15更新计算机 / 源码和原理20 分钟读完 (大约3037个字)

HashMap扩容导致的生产问题

HashMap的扩容问题作为Java八股文的重要考点之一，已经背得滚瓜烂熟，但还是在生产中踩了坑（总有一个坑的形状适合你）。这里再记录一下当时的复盘。

问题概述

2023.10.27，某国0点开始，业务投放量同比前一天出现明显下跌（约30%），当天下午通过报表数据发现了此问题，晚上20:00修复代码后数据恢复。

问题发现过程

11:00，下游业务触发限流，发现流量上涨了一倍多，但因临近大促以为是大促流量，直接调高了限流阈值，没有引起重视
16:20，算法同学发现业务投放量有明显下跌，开始排查问题，看到是从0点开始，业务投放量同比昨天下跌了30%左右。排查入口流量，发现流量平稳，并没有大促带来的流量，说明可能是代码问题，排查陷入僵局
19:00~20:00，找到问题原因，修复代码并发布

2024-08-09发表2024-08-09更新计算机 / 源码和原理7 分钟读完 (大约1029个字)

动态代理调用的实际运用

动态代理在实际工作中很难用到，通常都是一些底层组件才会使用，比如SpringAOP。但由于业务正在做“降本增笑效”的多租户改造，因此正好有了使用机会。

我们的业务分布在6个国家，每个国家都有独立的服务器、数据库、中间件，然而每个国家的用户数、使用APP时间段、使用习惯等各种因素导致服务器资源的使用效率不高：有的服务可能CPU在1%～10%使用率，为了高可用却仍然需要至少4台服务器，资源会有浪费。现在要做的就是把业务、服务器、数据库均合并，通过全链路携带“租户标记TenantId”来区分请求来源，所有国家共用服务器和数据库资源。

实现的方式很简单，类似skywalking这种tracing组件，利用ThreadLocal等数据结构，将类似“业务_国家_语言_货币单位”这种请求标记全链路传递。

2023-10-29发表2023-10-29更新计算机 / 物联网1 小时读完 (大约10070个字)

MQTT3.1.1协议解析

协议产生背景

MQTT (Message Queuing Telemetry Transport，消息队列遥测传输协议），是一种基于TCP/IP网络协议栈的应用层协议。MQTT最开始是1999年IBM公司用于通过卫星通信连接石油管道监测系统而创造的协议。
这种场景的特点是：

2023-08-29发表2023-08-29更新计算机 / 物联网14 分钟读完 (大约2161个字)

百度开源MqttBroker：BifroMQ分析

2023.07.17收到了百度开源IoT Broker的好消息，一直没有时间看。最近工作闲下来了，准备分析一下它的实现。

2019年开发Broker时，调研了很多实现方式，百度IoT是我特别想参考的实现，只可惜当时并没有开源代码可以参考，通过对实现方式的猜测，总结了这篇文章：《百度IoT：MQTT Broker架构设计》，不过现在开源版本改动了很多东西。

我们以BifroMQ v1.0.2版本来分析。

2023-05-20发表2023-05-20更新计算机 / 源码和原理8 分钟读完 (大约1212个字)

Fastjson的＄ref在接口参数兼容上的隐患

假设应用1给应用2提供了一个接口，需要更新参数，将Map变为List<Map>，很容易写出这样的兼容代码：

@Data
public static class OldClass {
    private Map<String, String> bbbb;
}

@Data
public static class NewClass {
    private List<Map<String,String>> aaaa;
    @Deprecated
    private Map<String, String> bbbb;
}

然而在部署后发现，应用2拿到的数据对象中的bbbb，没有任何数据。

2023-05-13发表2023-05-13更新计算机 / 机器学习和人工智能19 分钟读完 (大约2909个字)

使用ChatGPT和StableDiffusion给Hexo文章添加封面图

最近想添加封面图，想尝试使用StableDiffusion的AIGC自动生成封面图。但是，国内chatGPT很容易被封，像DALL·E这种又没法注册，国内百度的文言一格等未开放API，所以只有使用开源大模型了。

类似github管理代码仓库一样，比较有名的管理开源大模型的网站主要有2个：

国外：huggingface
国内：ModelScope（阿里合作）

考虑到第一次使用，学习曲线需要比较平缓才好入门，我使用国内的ModelScope来做大模型HelloWorld。最终决定使用阿里达摩院提供的中文StableDiffusion-通用领域这个大模型进行生成。

2023-04-30发表2023-04-30更新计算机 / 机器学习和人工智能20 分钟读完 (大约3045个字)

近期对chatGPT的理解

一、和之前“人工智障”的差异在哪里

1、能联系上下文，并不是一问一答，而是连续对话。

天猫精灵这类初代AI，只能做“天气如何”-“今天的天气是”，“今天几号”-“今天是”，这样一问一答的对话。但是一次问答通常只能“查询属性”、“执行命令”这种简单操作，人类的任务通常更复杂，需要分析对方答案并再次提出问题，直到双方观点对齐。chatGPT能够分析上下文，提供了连续问答的能力，所以现在有很多玩法是，让chatGPT扮演某个角色，然后以角色身份进行交互。

2、能够自我纠错，“你这里错了”，且具有主见，“我认为没有错”。

在连续对话的能力下，我们可以指出chatGPT答案中的错误，chatGPT会分析自己答案中的错误，并以更大的正确概率去修正答案。为什么通过指出错误能得到更正确的答案？目前的主流观点认为，这样做相当于把大任务划分为了小任务，单步拆解能给到更好的提示，辅助下一步的推理形成良性循环，因此最终大任务也具有更高的正确率了。

利用大模型给项目起有趣的名字

给项目起个有趣的名字！

JDK21虚拟线程

虚拟线程的设计动机

尼姆博弈游戏

《十天后回到现实》：黑色大楼

游戏描述

HashMap扩容导致的生产问题

问题概述

问题发现过程

动态代理调用的实际运用

MQTT3.1.1协议解析

协议产生背景

百度开源MqttBroker：BifroMQ分析

Fastjson的＄ref在接口参数兼容上的隐患

使用ChatGPT和StableDiffusion给Hexo文章添加封面图

近期对chatGPT的理解

一、和之前“人工智障”的差异在哪里

1、能联系上下文，并不是一问一答，而是连续对话。

2、能够自我纠错，“你这里错了”，且具有主见，“我认为没有错”。

follow.it

链接

分类

最新文章

归档

标签