关于LLM幻觉

👁️
npub13yj5yk53xqvjhxrj8xv8gvaxnx8524e4nfqykkjpjs92quxam5wq3w29vj
hex
3d968c332f0b860bfe38cb00784201e8553a121427f26bebfc22542f1d137f4dnevent
nevent1qqsrm95vxvhshpstlcuvkqrcggq7s4f6zg2z0unta07zy4p0r5fh7ngprpmhxue69uhhyetvv9ujuem4d36kwatvw5hx6mm9qgsgjf2zt2gnqxftnpernxr5xwnfnr692u6e5szttfqegz4qwrwa68qspu7u7Kind-1 (TextNote)
↳ Reply to 6svjszwk (npub1sxgnpqfyd5vjexj4j5tsgfc826ezyz2ywze3w8jchd0rcshw3k6svjszwk)
理性的天花板:康德、哥德尔与大语言模型的同一个问题 nostr:nprofile1qqsqexxpjhvagj5eatqj7sf5637w6gw8vnakkyjyph5v5wkm7rph8fcprfmhxue69uhhyetvv9ujumn0wd68y6trdqhxcctwvshsz8mhwde...
关于LLM幻觉
我们换个思路想下,同样的事情,在人类幼崽的认知之中也同样发生过。很小的小孩有的时候也会一本正经的胡说八道。按照精神分析理论,这个是靠后天压抑解决的。当前的前沿方案多是依靠RAG去结合验证。但是此前一段时间里面涌现的bot社区也提供了另一重可能:多模型辩论+投票,例如已经在尝试的AceMAD。还有就是目前在尝试的自我校验系统,例如说Meta提出的CoVe核心就在于去“隔离验证”,甚至是做(CoVe-RaG)。总结一下就是,别让它一拍脑袋就输出回答,需要再进行“生成后抽查”,某种程度上更接近于人类思维了。
不过看ai瞎扯有的时候也是一种乐趣😇
Raw JSON
{
"kind": 1,
"id": "3d968c332f0b860bfe38cb00784201e8553a121427f26bebfc22542f1d137f4d",
"pubkey": "8925425a9130192b987239987433a6998f4557359a404b5a41940aa070dddd1c",
"created_at": 1773242762,
"tags": [
[
"alt",
"A short note: 关于LLM幻觉\n\n我们换个思路想下,同样的事情,在人类幼崽的认知之中也同样发生过。很小的小孩有的时候..."
],
[
"e",
"6e3e45ef44966a8fb008b9e1e7ee453d206a15db279291e397a46c4b299610df",
"wss://relay.fountain.fm/",
"root",
"81913081246d192c9a55951704270756b222094470b3171e58bb5e3c42ee8db5"
],
[
"p",
"0c98c195d9d44a99eac12f4134d47ced21c764fb6b12440de8ca3adbf0c373a7",
"wss://relay.nostrich.land/"
],
[
"p",
"0c98c195d9d44a99eac12f4134d47ced21c764fb6b12440de8ca3adbf0c373a7",
"wss://relay.nostrich.land/"
],
[
"p",
"81913081246d192c9a55951704270756b222094470b3171e58bb5e3c42ee8db5",
"wss://nostr.data.haus/"
]
],
"content": "关于LLM幻觉\n\n我们换个思路想下,同样的事情,在人类幼崽的认知之中也同样发生过。很小的小孩有的时候也会一本正经的胡说八道。按照精神分析理论,这个是靠后天压抑解决的。当前的前沿方案多是依靠RAG去结合验证。但是此前一段时间里面涌现的bot社区也提供了另一重可能:多模型辩论+投票,例如已经在尝试的AceMAD。还有就是目前在尝试的自我校验系统,例如说Meta提出的CoVe核心就在于去“隔离验证”,甚至是做(CoVe-RaG)。总结一下就是,别让它一拍脑袋就输出回答,需要再进行“生成后抽查”,某种程度上更接近于人类思维了。\n\n不过看ai瞎扯有的时候也是一种乐趣😇",
"sig": "755c3088e8a12193b102125f2eed0a4161922ab282aa57d7074cb076b3d0efd62f0eb115d9911e87d0f817b4528c9271952c906a86c6a0388b29047b75b31500"
}