步骤越多,幻觉越多 - 幻觉逐步积累,甚至并不比朴素搜索RAG优 #86
Replies: 6 comments
-
perplexity - 非Pro - 5个来源 perplexity - Pro - 8个来源就认为sufficient |
Beta Was this translation helpful? Give feedback.
-
然后我看这个评估。该不会是,我的这个问题样例不是预期的吧...那么这种直接查询式的问题都没法处理,为什么可以在更复杂的,比如对比、分析的任务上更好呢? 如果可以,希望能分享一下一些好的案例。 |
Beta Was this translation helpful? Give feedback.
-
感谢关注和发现的问题,同时提出了几个很棒的建议!👍
对于第一点这种动态灵活获取大量的网页确实带来一些问题
我们针对这些提供了一些初步的解决方式:
针对提出的问题 |
Beta Was this translation helpful? Give feedback.
-
Hi, 产品的思路很好, 我会长期关注, 建议创建一个X的账号发布更新动态. 我认为基于您的产品思路, 随着大模型能力的推进, 你们会有更好的效果出现. 但我刚才测了一下, 目前来看现阶段无法使用. 我搜索的问题是一个特定领域的专业问题: 您返回的搜索结果对比pplx-pro和Felo-free有如下问题:
|
Beta Was this translation helpful? Give feedback.
-
十分感谢关注!!
|
Beta Was this translation helpful? Give feedback.
-
例子:
像极了很多Agent LLM应用,步骤很多,看起来很炫酷,然后积累幻觉,不太可用。
Beta Was this translation helpful? Give feedback.
All reactions