核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
很符合我对Rust壬的刻板印象 为什么Rust实现比c快 s...
2025-06-22阅读全文 >>确实性能强大,我感觉单机TPC-H应该是跑的最快的了。 原理...
2025-06-22阅读全文 >>因为其他人根本不用学。 举个例子,韩觉得自己傀儡术天赋很高...
2025-06-22阅读全文 >>我把话放这,以菊花这家公司的尿性,永远不会有厂商真心实意为它...
2025-06-22阅读全文 >>在B站看了很多他的栋笃笑,记得一段 他买寿司给爷爷吃,爷爷说...
2025-06-22阅读全文 >>