打造中国最大的
AI交流社区平台

最新动态

关于 工具的使用教程和指南-文章内容生成器(gpt4)

目前站主有留意到很多用户使用文章内容生成器的工具,因此写下教程,供大家更好地使用,如何使用能提高文章质量和字数。

我就以《粮食浪费问题与农业可持续性》为题,展示写一篇小论文。(建议先把全文看完理解后再进行生成)

1. 首先进入内容生成器,将题目输入进去如图所示:

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图

可能有小伙伴问,那写作风格,写作语气,关键词,文章长短怎么办?站主告诉你,先凉拌,先不管,先生成小标题。因为如果我们写关键词之类的,是要动自己的脑子的,能用AI尽量用AI,除非你本来就自己有想输入的关键字。

2. 接下来点击生成小标题

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图1

粮食浪费现象对农业可持续性的影响分析
探讨减少粮食浪费的策略与实践路径
提升农业生产效率:应对粮食浪费的长期解决方案

3.继续点击生成内容,接下来的内容就是我们拿关键词的内容!

结果是这样:

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图2
关于
工具的使用教程和指南-文章内容生成器(gpt4)插图3

4.拿到文章之后,要知道自己的主题是什么:粮食浪费问题与农业可持续性,从里面内容获得关键词,当然你也可以直接复制拿到这篇文章。但是作为一篇合格的论文,应当有小标题与大标题才对。所以从内容中选取的关键词是:粮食安全、环境保护、农业生产效率、资源循环利用、废物、污染、食品产业链、消费、智能化、生物农药、有机肥料、社会。(这几个可以从上面截图中获得,都是从文章中获取。)

5.正式进入写论文 《粮食浪费问题与农业可持续性》 步骤

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图4

这方块可以进行复制文本

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图5

一、粮食浪费全球现状:量化数据与统计洞察
二、案例深度剖析:国际粮食浪费典型事例
三、粮食浪费问题的影响与挑战:环境与经济维度分析

拿到这几个标题,不着急生成内容。我们要做的是,一步一步来,之前提到过,一篇合格的论文是需要有大标题和小标题,因此我们用上面来当做大标题。现在以:一、粮食浪费全球现状:量化数据与统计洞察为例子。应当做的事就是将大标题放入标题,继续生成小标题内容。

这时候可以进行生成内容了。

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图6

生成内容后:

关于
工具的使用教程和指南-文章内容生成器(gpt4)插图7
关于
工具的使用教程和指南-文章内容生成器(gpt4)插图8
关于
工具的使用教程和指南-文章内容生成器(gpt4)插图9

就按照这样的步骤进行生成论文,如果你还需要个更多的字和更长的内容,你可以再生成多一层标题来进行生成文章,就是一直套娃。可能有用户会问为何要这么复杂?我的回答是:由于目前gpt生成所消耗的token有限,无法立即生成几万字几千字的文章,所以需要人工干预,目前的内容生成器版本是最好的了,因为搭载了gpt4模型。

(建议生成内容时设置文章长度为:短。生成标题时可以使用中、长。原因也是由于token问题,文章内容生成不完全。建议组合:1.生成标题选择短,生成文章选择中。2.生成标题选择长或中,生成文章选择短)

最后有什么疑问欢迎评论,或者发邮件给我:937476264@qq.com 进行反馈。

以下是我生成出来的最终成品:

如果认为站主写得好,帮忙点点旁边广告或者给辛苦的站主给个小鸡腿吧~

关于本站的一些建议收纳与反馈

亲爱的用户们,我们的 网站非常重视您的意见和建议!您的反馈对我们来说非常重要,帮助我们不断改进和提升网站体验。无论是关于功能、设计、内容或其他方面的建议,我们都非常期待听到您的声音。请花点时间告诉我们您的想法,帮助我们打造一个更好的 社区。

此外,我们也非常关注您在使用我们的 网站时是否遇到了任何bug。如果您在浏览、搜索或与网站交互的过程中遇到了任何技术问题,我们希望听到您的反馈。请详细描述您遇到的问题,包括出现问题的具体页面、操作步骤,以及任何错误信息。这将有助于我们更快地找到并修复问题,让您的使用体验更加顺畅。感谢您的合作!

直接在下方评论区进行回复即可, 感谢您的支持和参与!

AI检测人工智能课堂如何检查文章是否由AI编写(ChatGPT)

即使只是花了几分钟玩ChatGPT的人,多半会感到惊讶。但我们开始看到越来越多的AI写作内容——很难分辨到底哪些是人类所写。

AI检测人工智能课堂如何检查文章是否由AI编写(ChatGPT)插图
随着AI风靡全球,许多人开始质疑他们在线阅读的真实性。虽然AI写作检测工具并不是100%准确,但有一些综合方法可以帮助你解读所阅读内容的来源。

这有关紧要吗?如果你正在阅读这篇文章,我猜你绝对很关心。我也是。我每天都与作家合作。我无法容忍由AI生成的垃圾(或者当本来应该由人亲自撰写时,却用了AI生成的文字)。

优质内容不分来源。但除了实际写作质量之外,使用AI进行写作的伦理问题越来越普遍。

一些文章、论文和报告悄悄发表了机器产生的废话……这令人相当担忧。

我曾经和一些作家合作,明确告诉他们不要使用AI生成的论文,但他们还是尝试将其当作自己的作品。

我不会坐在这里说我讨厌ChatGPT,事实上,恰恰相反——我每天都在使用。但我认为应该由出版商决定他们的文字来源。

如果你没有被允许这样做,不要使用ChatGPT完成涉及敏感公司数据的商业报告,但可以放心使用它来加速你正在发明的新产品的描述。这正变成一个非常有趣的伦理问题。

随着GPT-4的发布,AI变得更加难以辨别。没有一种适用于预测AI的万能方法,特别是因为它并不是绝对的。你不能“检测”AI,只能预测它。

任何声称能做到相反的人都是在撒谎。情况变得如此糟糕,以至于连联邦贸易委员会都发表了一份正式声明。说到底,你只是在纸上看到了一些文字,对吧?

这并不总是直接的,也绝对不可证明。但有时候确定某物的来源确实是有帮助的。让我们讨论一些在尝试检查某物是否由AI编写或生成时要查找的技术和非技术因素。

如何判断一篇文章是否由AI编写
在Google的范围之外,学术界和其他专业人士看到了AI生成内容的大量涌现。因此,无论你是在学术、专业还是休闲环境中接触到内容,你可能希望找到一种验证某些内容是否由另一个人编写的方法。

检测AI生成的内容需要多个写作样本、各种工具和方法,仍然涉及一定程度的运气。不要依赖于单一的AI内容检测方法来断言某些内容是由AI编写的。这些只是上下文的猜测!

经过几个月的手动分析内容后,我发现自己仍然会因AI使用的复杂性而感到困惑。

虽然我曾以为大多数AI工具无法写出本科水平以上的内容,但在见识了GPT-4后,我的看法改变了。幸运的是,你可以使用一些工具和手动方法来帮助确定一段文字是否由AI辅助完成。

以下是我个人在2023年发现的用于发现AI内容的最佳技巧和工具:

方法一:使用不可检测AI的多检测工具
我们将首先介绍的工具是Undetectable AI,它可以帮助预测某物是否由AI编写。该工具通过检查内容使用经过调整的模型进行检查,该模型是根据每个AI检测器提交的批处理文档进行训练的(原创性、GPTZero等)。

在幕后,该工具根据训练情况分配一个可能性,以便根据所有经过测试的内容给出一个可预测的结果。

因此,当使用Undetectable时,该工具基本上会同时检查8种不同的检测器返回的AI写作可能性。

虽然这并不是最终结论,但它是一个非常有帮助的预测。这些工具中没有一个应该被视为绝对准确,决策也不应仅依赖于这些工具,但它们绝对有助于提供否则无法知道的上下文信息。

要使用Undetectable的AI检查器,请将你的写作样本粘贴到输入框中并提交进行测试!你将看到来自流行检测工具的结果,例如GPTZero、Writer、Crossplag、Copyleaks、Sapling、Content At Scale、Originality和ZeroGPT。

我提到过这个工具是免费的吗?!

Undetectable AI根据ChatGPT写作返回检测到的AI文本。所有检测器:GPTZero、OpenAI、Writer、Crossplag、Copyleaks、Sapling、ContentAtScale和ZeroGPT。

方法二:CopyLeaks AI检测器
最近出现的一个AI检测器是Copyleaks,它的准确性非常高。该检测器会警示你,如果它认为某段文字是由AI编写的或者是人工编写的,并没有其他太多的内容。你可以悬停在你认为可疑的文本部分(特别是高亮显示为红色的文本)上,然后查看百分比的分解。该工具支持GPT-4,并有两个检测模型,基础版和增强版。

他们还推出了一个免费的Chrome扩展程序,可以直接检查你的浏览器。该工具可用于检查个别实例的AI写作,但如果你想在短时间内扫描大量文档,则需要付费计划以使用API。

Copyleaks AI检测器输入框显示某些句子在段落中被标记为(或至少标记为)AI写作

如果切换到增强模型,你将被要求登录(或创建一个帐户)。在表面上看,这似乎并没有改变任何东西或描述任何AI如何编写。这可能只是一个吸引人注册的手段。我建议使用他们的基础测试器进行一般AI写作测试。

方法三:Originality.ai检测器 + 文本可视化工具(付费)
如果你想进一步测试你的文章是否被多个检测工具检测,你可以使用Originality AI来检查和可视化写作。Originality是我使用过的最严格的AI检测软件。

它真的致力于打击AI生成的写作,但相较于其他工具,它更容易过度诊断(误报)。如果你输入AI写作,它几乎肯定会标记为AI。

文本可视化功能是它与许多其他AI写作检测工具的不同之处。如果你有作家,请使用Originality检查他们的写作,然后使用他们的可视化器重新构建文章。

这只在你使用Google文档检查写作时才会起作用。但如果是这样的话,你可以使用他们的Chrome扩展来“重建”文章,看看它是如何写的。效果如下所示:

Originality.ai的文本可视化工具展示作家将写作复制粘贴到文档中

结合这个工具的复制/粘贴检测功能,你将对你怀疑的写作来源有很好的直觉。在上面的例子中,我实际上给了我雇佣的一个作家一个任务,他们使用AI生成了大约一半。在事物被复制粘贴之前,你可以清楚地看到这一点。

Originality使用了GPT-4和其他自然语言模型(所有模型都经过大量数据的训练)来确定内容是否看起来可预测。Originality似乎是唯一一个非常适用于ChatGPT和GPT 4(公开可用的最先进的生成语言工具)的AI内容检测工具。

从每100个单词开始的定价,如果你在寻找更专业、行业级别的内容检测检查器,这是相当合理的。我在使用它时运气不错,将继续在检查生产级别的文稿时使用它。

你可以像以前一样可视化写作,也可以简单地将你的文本粘贴到输入框中,就像其他所有工具一样。作为一个额外的功能,它还可以默认检测抄袭。

记住,5%的AI并不意味着样本中有5%是由AI编写的。这意味着如果你投掷100枚硬币来预测某物是否是由AI编写的,检测工具会在这100次中猜测有5次是由AI编写的。老师们一直误解了这些百分比的值,这导致学生陷入麻烦。这不好……

至于抄袭,它也非常令人印象深刻。Originality能够找到我“抄袭”内容的确切博客,并将文本标记为从网站(就是这个!)复制的内容。它能够如此迅速地找到这篇文章,让我印象深刻。就我个人而言,结合AI检测与抄袭检测是对写作内容来源更加确信的额外措施。

Originality对于任何希望自动化和轻松测试写作的人来说都是我的首选工具。与Undetectable.ai不同,Originality适用于更深入的内容检查。

它们还将你的扫描结果保存在你的帐户仪表板中,以便将来方便查看。

请记住,没有什么是真正确定的,我想要强调这一点。这些工具都是预测器。但为了增加预测的信心,你应该使用多个来源来测试、验证和可视化你怀疑的内容——而Originality目前是最擅长深入挖掘的工具。

可接受的检测分数
根据Originality的CEO所说,如果内容始终在10%以下,几乎可以确定没有问题!只有当内容接近40或50%的AI时,你才应该开始怀疑其来源。

你输入的样本越长,检测的准确性就越高(样本大小越大=可靠性更高)——但可靠性并不意味着准确性!此外,通过同一作者扫描更多的内容应该能够更好地帮助你判断他们的写作是否真实可信。

但要小心,有些结果可能是误报或漏报。与其根据单篇文章或文本片段做出判断,还不如审查一系列文章,然后判断一个作者或服务。

检查整个网站
如果有一系列持续高或低的检测分数,那就应该是你判断这些内容是否是由AI编写的最大指标。一篇单独的文章并不能证明整个网站(或多个内容文件)是否有AI的帮助编写。同时,重要的是要对这些检测工具持保留态度(我不能强调这一点的重要性!)。检查来自同一来源的更多文章会产生更大的统计样本,但是除了网站能做到的之外,还有许多因素影响检测。其中一些因素包括语法、重复和缺乏复杂性,我们下面会详细讨论。

Originality最近推出了一款一次性检查整个网站的工具。

方法四:使用GPTZero(非常小心和准确的检测)
我喜欢GPTZero,因为他们似乎是唯一一个关心他们标记的AI检测公司。虽然他们无法保证100%的准确性,但只有在他们对AI写作很有信心的情况下,他们才倾向于标记一些内容为AI。

他们更关注学术和教育写作,在我的非正式文章中我使用了这个工具,因为它可以进行最深入的分析。Undetectable对于简单地快速检查多个工具很好,Originality对于可视化很好,但GPTZero是我最喜欢的检测工具。

这个工具由一组才华横溢的机器学习和软件工程师组成,建立在7个技术”组件”上,很可能是目前公开可用的最准确和可靠的AI检测工具。去GPTZero免费试试吧,并尝试在各种不同类型的内容上使用(你也可以直接上传文件)。

如果你试图把上面的段落输入到GPTZero中,你会得到0%的AI几率(这是真的…我现在就坐在沙发上写这篇文章,我很确定我不是机器人)。它真的很厉害,能明确地知道有0%的机会是由AI写的。甚至一点点都没有。

方法五:Content at Scale AI检测器(轻松的休闲写作和免费的)
Content at Scale团队推出了一个免费的AI检测器,这是目前最好的工具,用于快速检测AI写作。这个工具基于数十亿页的数据进行了训练,可以一次测试多达25,000个字符(将近4000个单词!)。

要使用这个工具,只需将写作粘贴到检测字段中,然后提交它进行检测。在几秒钟内,你将看到一个人工内容分数(表示一段文字可能是由人类撰写的可能性),还会看到一行一行的分解,突出显示你的内容的哪些部分被标记为可疑或明显的AI。

AI预测的一个很大的部分是尝试重现模式。模式是很好的指标,因为AI生成器基本上就是通过训练来识别它们以产生最符合现有模式的内容。你的文字越符合现有的写作格式,它就越可能是生成的。

下面是两个ChatGPT输出与人类写作的对比截图。测试后,你也会看到预测性、概率性和模式分数。这些分数是对幕后情况的简化解释。人类产生的文字并不是非常可预测的,因为它不总是遵循模式。而AI写作正好相反,它只知道模式。

阅读这两个摘录,看看你能不能分辨出写作的不同。第一个似乎非常专业,但你几乎可以感受到下一个句子是关于什么的。人类的结果更加零散。它仍然是好的写作——只是更富有创造力。如果你想了解写作内容是由AI生成的,那就去Content at Scale吧,那里有一种高度准确的、一行一行的说明发生了怎样的情况。这里是两个截图,一个是混合了人类生成和AI内容的检测结果(50%可能),另一个是似乎完全由人类生成的内容检测结果(100%可能)。

方法六:Sapling的AI检测器
我从未使用过像Sapling AI这样的AI检测器。表面上看,它看起来简单,类似于GPTZero和Copyleaks。但是,不要被它的外表所欺骗。这绝对是我使用过的最严格的检测器之一,并且随着最新更新,它的性能只会变得更好。

这个工具与市场上的其他检测器一样工作。只需将你的文本粘贴进去,等待几秒钟,你将得到一个AI可能性百分比的输出,并且会对文本中可能是非人类生成的部分进行高亮标记。

它不仅可以精确检测到ChatGPT和Claude的内容,还可以精确定位那些使用Undetectable AI和HideMyAI等绕过工具转换的AI文本。

这个检测器是由斯坦福大学、UCB、Google和Meta的前开发人员构建的——在其AI检测的稳健性方面,这一点非常明显。

方法七:Writer.com的AI内容检测器
尽管检测AI内容的参数不清楚,但Writer.com提供了一个简单的、免费的AI写作检测工具。你可以通过URL或直接将文本粘贴到他们的工具中来运行扫描。我在使用它时效果很好,但很难找到它们确定标记内容的方法。

该检测器包括1500个字符的AI内容可免费检测,随时可以使用。它在检测ChatGPT生成的内容方面做得相当不错。

方法八:技术和句法迹象
要判断一篇文章是否由AI生成,另一种方法是查看写作的技术方面。这并不是很确凿,可能会显得显而易见,但如果你对之前的工具感到困惑,或者只是想更深入地分析你遇到的写作,你应该深入研究内容。以下是一些要注意的事项:

  1. 注意过渡词。ChatGPT喜欢使用过渡词。每隔几行它就会插入一个。例如“此外”、“另外”、“而且”、“因此”和“所以”经常出现,但在人类写作中并不总是出现。除非是更正式或专业的写作,否则我们并不会频繁“过渡”我们的写作。
  2. 大词汇词汇是可疑的。利用、实施、利用、阐明和确定等大词汇通常被过度使用,但在一般文章中,哪个人会像那样说话呢?几乎没有人。

人们在谈论时,更常见和更具可比性的是用过、解释和发现等更简单的词汇。

如果你使用了其中一种检测工具测试内容,并且内容是富有创造性和独特性的,我会说它是合乎规定的。那些在技术上表现自信但让人怀疑的内容,你需要进一步调查。

  1. 重复的词语和短语:另一种识别AI生成内容的方法是查看词语和短语的重复。这是AI试图用相关关键词填充空间的结果(也就是说,它并不真正知道自己在说什么)。

因此,如果你阅读一篇文章,感觉好像同一个词被反复使用,那么它更可能是由AI写成的。一些垃圾邮件式的AI生成SEO工具喜欢在文章中堆砌关键词。关键词堆砌是指你重复一个单词或短语,以至于听起来很不自然。

有些文章的目标关键词似乎几乎每隔句子出现一次。一旦你发现了它,你就无法专注于文章。对读者来说,这也是非常让人反感的。

  1. 缺乏分析:判断一篇文章是否由AI生成的第三种方法是它是否缺乏复杂的分析。这是因为机器擅长收集数据,但不擅长将其转化为有意义的东西。

如果你阅读一篇文章,感觉它只是一堆事实而没有深入分析,那么它很有可能是由AI写成的。对于ChatGPT来说,我们正接近AI能够开始分析写作的阶段,但我仍然觉得它的回答非常“机械”。

人们开始使用AI回复推文,但却没有意识到他们的回应是多么刻板!你会注意到,AI生成的写作对于静态写作(比如历史、事实等)要好得多,而对于富有创意或分析性的写作则要差得多。一个主题所包含的信息越多,AI就越能够更好地写作和处理它。

  1. 错误数据的幻觉:这种情况更常见于AI生成的产品描述,但在博客文章和文章中也能找到。这是一个巨大的指标!由于机器从各种来源收集数据,它们有时会犯错,或者简单地没有更新。

如果一个机器不知道某件事,但需要给出一个输出,它会根据模式(并不准确的模式)预测数字。这种情况经常发生,是(在我看来)判断AI的最简单的方法。

因此,如果你在阅读一篇文章时发现事实和数字之间有几处不一致,你可以非常有信心地说你刚刚读到的是用AI写的。如果你遇到了垃圾内容,请向谷歌举报。让别人不必浪费时间阅读明显不准确的东西!

方法九:验证你的来源和作者的可信度
这可能对于一个单独的博客来说似乎有些多余,但仍然值得一提。如果你正在阅读一篇文章,而域名似乎与发布的内容毫无关联,那么这是你的第一个警告信号。但更重要的是,你应该检查文章中使用的来源(如果有的话)。如果一个作者使用来自有问题的网站的来源,或者只是在没有任何来源的情况下声明某些事情,要么是作者没有进行研究,要么可能只是在自动化一堆AI生成的内容。

如果你想在谷歌上检查一篇文章,点击菜单,查看谷歌对该网站的所有信息。以下是我们的情况:

查看谷歌在Gold Penguin网站上的历史记录

你可以看到我们大约在2年前被谷歌索引,但谷歷新闻不是很了解我们。将这些信息与你自己的判断相结合,判断某件事是否值得信任。

谷歌显示它第一次对Gold Penguin网站进行索引的时间以及它无法找到该网站的太多信息

OpenAI停止了他们的官方AI检测器
这个疯狂背后的公司OpenAI,几个月前发布了一个工具来帮助检测写作。使用官方工具,OpenAI最初声称他们测试的AI写作样本中只有26%被正确识别为AI。

在网络营销和写作社区对该工具的准确性产生怀疑后,似乎他们是正确的,因为OpenAI于2023年7月20日停止并从他们的网站上移除了他们自己的AI检测工具:

截至2023年7月20日,由于其低的准确率,AI分类器不再可用。我们正在努力吸收反馈,并正在研究更有效的文本来源技术,并承诺开发和部署机制,使用户能够了解音频或视觉内容是否由AI生成。

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text我对这个检测工具的初步看法是它看起来像是抛硬币。我测试了很多来自ChatGPT的输出,结果是“无法确定”和“不太可能由AI写成”。我从未使用过这个工具。

我建议使用类似于Originality和Content at Scale这样的工具,可以提供一些不错的见解。请记住,没有什么是100%确定的,这也是OpenAI从他们自己的网站上移除该工具的原因之一。

巨型语言模型测试室不再工作
来自MIT-IBM沃森人工智能实验室和哈佛自然语言处理组的三位研究人员创建了一个名为Giant Language Model Test Room(或简称GLTR)的优秀免费工具,来帮助检测机器生成的文本内容。GLTR是一种最直观的方式来预测是否是由AI生成的文本。

每个单词都根据左边的上下文预测的单词,来分析其可能性。如果这个词在前10个预测单词内,背景就会被着色为绿色;如果在前100个预测单词内,背景将被着色为黄色;如果在前1000个预测单词之外,则是紫色。如果你看到内容中有很多绿色,那很可能是由AI生成的。

这是AI模型之间差异的一个很好的指标。虽然它不能完全确定,但却是一个相当不错的指示。它不再可用,但是对目前检测这篇文章对每个词进行分析,根据左侧的上下文,分析每个词成为预测词的可能性。如果该词在前十个预测词内,则背景颜色为绿色;如果在前100个内,则为黄色;在前1000个内,则为红色;否则为紫色。如果你看到大量绿色内容,很可能是由人工智能生成的。

以下是人工智能生成的文章节选与人类撰写的文章的对照。你可以看到人工智能生成的文本比人类撰写的文本多得多地突出为绿色。

人工智能生成的文章文本,明显以绿色为主要突出显示
纽约时报的文章,通过不同的高亮颜色显示,不太可能是由人工智能撰写的
虽然不是绝对可靠,但是是一个相当不错的指标。这个方法已经不再适用,但对于了解当前检测器的工作方式还是很有见地的。

金企鹅的AI检测工具
几周前,我和一个开发团队一起创建了我们自己的AI检测工具。我厌倦了使用那些过度检测大量文本的工具。如果辨别某物是否由AI编写如此困难——我宁愿不管它。我不希望任何未经检测的东西被检测出来,即使这意味着我会让一些真正的AI通过。但这没关系,这项技术毕竟不能准确地检测一切。

这个工具是免费的,和其他工具一样,只能作为参考。它非常适用于让你知道某些内容明显是由AI生成的,但对于更复杂的工具,你可能应该使用另一个工具。

金企鹅自己的AI写作检测工具,不会过度检测非AI生成的内容
其他在线检测方法
当你找到声称可以检测内容是否由AI生成的随机网站时要小心。如果你正在寻找AI内容检测工具,请确保它们描述了他们检测内容的方式——因为”ai检测”本身并没有任何意义!

最后的想法和接下来的发展方向?
要确定一篇文章是否由AI撰写并不是最容易的事情,因为你事实上无法确定。更糟糕的是,人工智能每天都在变得更加优秀。几个月后GPT-5会是什么样子?我甚至无法想象。

也就是说,如果你怀疑一篇文章是否由AI撰写,最好的方法是结合所有这些工具以及你自己的判断力。对同一作者的多篇文章进行测试以提高可靠性。

请记住要对所见到的结果持保留态度。你所看到的东西在任何方面都不是确定的,因为没有一种确切的方式来检测AI。记住你所处理的东西没有水印,你只是在屏幕上看到文字而已。

希望这些新工具能让怀疑论者通过互联网、新闻以及世界各地的学校系统过滤出由AI生成的内容。

随着人工智能变得越来越复杂,人类和机器生成的内容之间的界限变得越来越模糊,AI生成的内容变得难以区分只是时间问题!

让我们拭目以待未来几个月会给我们带来什么。

如果没有使用它,你就会被甩在后面—Copilot

如果没有使用它,你就会被甩在后面—Copilot插图

一、GPT-4带动Copilot聊天

现在你可以在你的代码编辑器中聊天,快速编写代码并快速获得答案

它还可以帮助检测安全漏洞,并在代码、终端和调试器中找到和修复错误

二、Copilot合作伙伴计划

这将为新的网络和创意注入GitHub Copilot生态系统

扩大开发人员使用人工智能的能力,与像Postman、DataStax等多个合作伙伴一起实现

三、人工智能安全

Copilot还可以帮助识别IDE中的安全漏洞,并迅速修复

四、Bing聊天现在被称为Copilot

  • 你可以在Edge、Chrome、Safari上使用它,将会很快在手机上使用
  • 你可以与它交谈以生成AI生成的艺术
  • 它可以写计算机代码
  • 它可以写诗

访问链接:copilot.microsoft.com

五、Copilot工作室

  • 创建可以与Microsoft 365一起工作的自己的AI助手
  • 用你的信息和文件教授这些AI助手
  • 在不需要了解编程的情况下在不同的网站和系统上设置这些AI助手

六、Word

• 通过简单的提示从简单的创建Word文档

• 总结长文档并提取关键信息

• 重新编写文本部分或整个文档,使其更简洁或与特定的口吻相匹配

• 总结对文档所做的最有意义的编辑和更改

七、Outlook

• 总结未读的电子邮件和电子邮件对话

• 通过简单的提示调整电子邮件的口吻和长度

• 在之前的电子邮件对话中安排跟进,创建议程

• 在准备会议时推荐与会人员、议程和文件

八、Teams

• 在会议期间提供实时的总结和见解

• 在会议期间记录关键点和行动项

• 通过提示生成聊天内容并调整口吻

• 根据之前的对话创建议程并提出讨论点

九、Microsoft Copilot工作室

• 允许构建与Microsoft 365整合的自定义AI助手

• 用公司的数据和文档训练合作伙伴

• 为IT提供监控和访问控制

• 在网站和平台上部署合作伙伴

十、最好的AI浏览助手

这是目前市面上最好的免费浏览助手。您可以访问任何网页并提问任何问题

Co-pilot甚至会提出相关问题并提供答案

十一、最好的AI阅读助手

对于长网页或文档感到压力吗?

只需召唤您友好的Co-pilot并要求对其进行摘要

十二、读取和提取PDF文件中的数据

您知道吗?您可以使用Co-pilot轻松提取PDF文件中的数据。这是非常有用的功能,但许多人并不知道

只需在Edge中打开PDF文件,然后单击Co-pilot按钮即可开始

十三、斜杠命令和智能命令

修复或改进代码只需输入/fix

生成测试从/tests开始

编写文档只需/docs

十四、Copilot Chat 在github.com和移动应用

现在,开发人员可以在Github上直接进行

代码
拉取请求
文档
提出一般编码问题

通过提供建议、总结、分析和答案进行对话

十五、免费访问GPT-4

微软Copilot在与OpenAI合作中使用GPT-4的能力

而且是免费的

切换到’创作模式’开启GPT-4,当前也正在推出插件功能

如果没有使用它,你就会被甩在后面—Copilot插图1

十六、现在你知道如何使用了,以下是2种访问方式

访问方式1:Microsoft Edge

在计算机或手机上下载Microsoft Edge浏览器,然后点击右上角的Copilot图标打开

访问方式2:Windows Copilot

新的Windows更新直接将Copilot集成到了电脑中

只需点击Copilot,你的电脑上就有了GPT-4提供的AI助手

十七、内联Co-pilot聊天

有了新的内联Co-pilot聊天,开发人员可以在他们的代码和编辑器中聊天,讨论特定的代码行

重大消息!ChatGPT 语音功能全量免费开放了!

今天早上 OpenAI 宣布,旗下人工智能聊天机器人 ChatGPT 的语音功能对所有免费用户开放。这项功能原本是付费plus用户的专享,现在所有用户都可以在移动应用中点击耳机图标,通过语音与 ChatGPT 进行交谈并获取语音回应。(划到文章末尾免费加入AI交流群,获取最新前沿信息和实践案例)

重大消息!ChatGPT 语音功能全量免费开放了!插图

消息一出,ChatGPT 又又又崩了。可能是因为消息太过于突然,人们开始蜂拥体验,导致 OpenAI 再次宕机。从 DevDay 开始,ChatGPT 开始三天两头的崩溃。GPT-4 的表现也出现了明显下降,反应速度变慢,答案质量也不如以往。现在也越来越引起人们的不满和对Openai能否提供稳定服务的质疑。

ChatGPT 的语音功能自 9 月份推出以来,一直备受关注。这项功能由TTS模型驱动,提供五种不同的语音供用户选择。用户可以与 ChatGPT 进行语音对话,无论是什么场景都可以通过语音与 ChatGPT 进行交流。

另外,ChatGPT 的语音功能有非常出色的人性化表现。所有语音模型都使用了真实声优演员录制的声音库,OpenAI 通过这个样本库开发了一个模型,能够以逼真的方式拼接单词和语言细微之处。这使 ChatGPT 的语音功能在强调和紧张的地方表现得非常生动,给人一种拟人化的感觉。

但是免费开放语音功能的推出时机引发了不少争议。OpenAI 最近的一些决策引发了质疑,altman和董事会的争执还在继续,公司内部也出现了一些动荡,Openai员工联名要求原CEO回归,plus订阅暂停等等一系列的事情,尽管如此,OpenAI 仍然决定在此时把 ChatGPT 语音功能免费开放给公众

这一系列事件中最令人担忧的是,服务的中断和不稳定对依赖 OpenAI的付费用户构成了直接威胁。如果公司无法在未来提供更多的付费专属功能和稳定可靠的服务,许多用户可能会在下一个付费周期取消他们的 Plus 订阅。对于那些正在基于 OpenAI API 构建应用的开发者来说,这也意味着要准备备用方案了

详细教程!一文教你如何免费使用GP4!

该教程帮助大家如何从零开始使用微软的Copilot

Bing Chat正式更名为Copilot,品牌升级意味着Copilot正在成为一个独立的新产品,用户无需先导航到Bing就可以访问。Copilot现在可以通过Bing和Windows使用,与ChatGPT一样,微软Copilot也有了自己的独立域名:copilot.microsoft.com,但与ChatGPT不同,Copilot上像GPT-4、DALL-E 3等功能全部免费开放!你只需登录微软账户即可使用(而ChatGPT需要订阅会员,每月20刀)。

微软Copilot的使用

首先,无论你使用的是手机、Mac还是Windows电脑,需要做的第一件事就是下载微软的Edge浏览器。目前,copilot只能通过Edge使用。微软显然是借此机会推广自家的工具。使用copilot有两种方式:一是直接访问网页入口,链接为:https://copilot.microsoft.com/,二是通过浏览器右上角的小图标直接访问。

Copilot的功能和特色

在copilot的页面里,微软提供了一些提示,告诉你copilot大概能帮你做些什么样的任务。简单拆解一下,其实有几种不同的类型,一类就是聊天,你可以直接问对应的问题;另外一个就是可以帮你设计你需要的表格,还有其他类型的任务,你可以理解为都是生成文本性质的,可以帮你写各种不同的东西。

详细教程!一文教你如何免费使用GP4!插图

对话风格选择

微软提供了不同的对话风格选项,这也是跟GPT-4非常不一样的特点,如果你选择更有创造力对话模式,你生成的结果是更开放性,更有可能有各种特殊的结果。如果你选择右边更精确的话,他会是更稳定,你可能重复问几次,获得的结果都会是类似一样的。不同的选择其实会对应不同的使用场景。

详细教程!一文教你如何免费使用GP4!插图1

图片生成和识图能力

接下来我们让他画一幅海报

详细教程!一文教你如何免费使用GP4!插图2

Dalle3理解图片的能力非常强,同时也可以根据我们的要求对图片进行进一步的修改,比如调整图片的局部显示,更改风格等。

接下来我们继续看一下识图能力

详细教程!一文教你如何免费使用GP4!插图3

我们把刚刚生成的图片中的一张交给Copilot描述,通过结果我们可以看到,他的理解非常精确,包括图片的场景细节和整体元素几乎完全涵盖。同时Copilot比GPT4更加独特的地方在于他可以在侧边栏随时唤醒,为我们总结一些文章信息。

Copilot和ChatGPT plus的差异

Copilot区别于ChatGPT plus 在使用场景上的存在一些特点和差异,以及Copilot现在依然存在的一些限制,但是我们可以通过一些prompt的方式去最大限度减少这些限制。包括它在处理中文询问时过度依赖搜索结果的问题,以及在处理复杂任务时的局限性。对于这些问题,下篇文章中我会提供一些解决方案,帮助大家更好地利用这一工具。

AI 爱好者论坛开始招募!

欢迎来到我们的 公益网站!我们致力于推广人工智能,让更多人了解和使用AI技术。作为一个非营利性质的平台,我们的宗旨是让AI走进每个人的生活,让技术更加普惠。

为了实现这一目标,我们计划翻译一系列英文AI相关书籍。为什么选择翻译这些书籍呢?因为这些书籍蕴藏着丰富的知识和最新的AI技术发展,但很多人由于语言障碍无法获得这些宝贵的信息。通过翻译这些书籍,我们可以让更多的人获得这些宝贵的资源,促进AI技术的普及和发展。

我们邀请您成为我们的核心会员,并加入我们的翻译组。利用GPT等技术,我们将免费翻译这些书籍,并在网站上免费发布。通过参与翻译,您不仅可以自己学习,还能帮助到其他人,为AI技术的传播贡献自己的一份力量。加入我们,让我们共同推动AI技术的普及化,让更多人受益!

AI 爱好者论坛开始招募!插图

大模型创业,谁赚到钱了?

大模型创业,谁赚到钱了?插图

本文深入探讨大模型技术的商业化趋势,以及在不断发展中找到赚钱路径,让我们一起阅读这篇文章,看看作者有何解读吧!

大模型创业,谁赚到钱了?插图1

只有亏钱赚吆喝,没有闷声赚大钱。

几年前,有人问自动驾驶赚不赚钱,一位CEO的回复是:这就像问“小学生赚不赚钱”,可能会逼他去麦当劳打工。

现在,很多人想知道大模型创业赚不赚钱,答案可能是:这就像大学生刚毕业去打工,还养不活自己。

大模型创业,看起来很火,但赚钱很难。一位大模型创业公司CEO参加了一场线下沙龙,到场的十多家创业公司,只有两家有收入。如果把研发费用算进来,没有一家赚钱。

投资人的期待很高。金沙江创投主管合伙人朱啸虎说,在中国做AI创业,必须考虑在什么场景下可以实现落地,并且第一天就要可以赚钱。

按这个标准看来,大部分创业者都不合格。

一些上市的互联网大厂,搞起了“反向营销”。比如360表示,大模型产品创造了2000万元相关业务收入;商汤宣布,生成式AI相关收入增长670%;美图称,大模型拉动公司利润增长3.2倍。

这些公司用各种加定语的表述方式,急匆匆地告诉外界自己赚到钱了。但仔细剖析你会发现,业务还是之前的业务,只是换了个名头,加了个帽子而已。

一位投资人直言,仍在试图搞清楚,哪些公司将把人工智能的前景转化为长期利润。他用冰球比赛来类比,“中间的冰球没有被控制住,没有人知道它会去哪里”。

大模型如何赚钱?这是一个很核心的问题。只有搞清楚这个问题,我们才能看清创业者往何处去,资本如何流动。

我们将这个问题进一步拆分成四小问——赚谁的钱?怎么赚钱?谁在赚钱?能赚多久?

一、赚谁的钱?

从终极买单人来看,大模型的商业模式可以分为两类——to C和to B(严格意义上还有to G,即面向政府,这里归入to B)。

在科技互联网行业,to C是一门好生意,边际效应足够明显。我们熟知的微信、滴滴打车、美团外卖、抖音短视频,都属于to C类产品。开发出类似的爆款应用,是很多创业者的梦想。

大模型行业有没有to C的爆款应用?

有,ChatGPT。

去年11月底,美国AI创业公司OpenAI推出ChatGPT,两个月获得1亿月活用户,让整个科技圈大为震撼。4个月后,月活用户突破10亿,史上增长最快网站诞生。

向这些用户收取订阅费,是一门好生意——OpenAI在2月初(月活刚过亿时)推出付费订阅版ChatGPT Plus,每月收费20美元。

随后美国涌现出一大批类似产品,基本都是面向C端使用,订阅付费模式。

据应用商店监测平台Sensor Tower的数据,2023年上半年AI应用下载量同比增长114%,突破3亿次,超出2022年全年水平;此外,AI应用内购收入同比激增175%,逼近4亿美元——虽然单个用户付费不多,但只要人够多,生意也够大。国内厂商推出的通用大模型产品,现在大部分是免费。

第一个吃螃蟹的大厂是百度,文心一言在11月1日上线专业版,每月收费59.9元。跟订阅模式不同,还有一种向C端提供产品,向B端(广告主)收费的模式,即“羊毛出在猪身上狗买单”。这是互联网行业的通用玩法,目前还没有几家厂商具备这个实力。to B的生意,规模很大,市场分散。大模型赚钱最直接的方式是,开放API接口。

早在2020年夏天,OpenAI推出GPT-3。次年1月,一家叫做Jasper的公司成立,通过接入GPT-3模型,针对市场营销场景做精调,自动生成各种风格的营销文案,当年就赚了3000万美元。它只需要向OpenAI支付调用API的授权费用。

所以,OpenAI最早的收入实则来源于B端。像Jasper这种需要向基础大模型调用API的公司,即大量的“开发者”,都是OpenAI等大模型公司的客户。

造物云是一家做AI设计解决方案的创业公司,他们在开发自有系统的过程中,就要调用外部基础大模型的API,包括GPT4、Baichuan-13B、ChatGLM2-6B等,按照调用量付费。

商汤在上半年发布“日日新”大模型时,产品没有向C端消费者开放,也不像百度和阿里等大厂那样提供内测机会,而是直接开放API接口,面向政企客户。

B端付费的另外一种方式,是SaaS模式。

AI厂商借助大模型的能力,给企业做方案、改系统、跑流程,最终降本增效。当然,这个过程是要收费的。这跟前几年热炒的产业互联网、企业数字化差不多。

造物云创始人邱懿武给「定焦」举了一个例子,他们曾帮助一家电子烟品牌做产品设计,花了100万找传统设计公司做了100多个方案,现在通过AI大模型,生成800个设计方案只花了10块钱的算力成本。

类似的逻辑,很多企业存在用AI替代销售、客服、理财顾问等岗位的需求。他们愿意为之付费。

二、怎么赚钱?

搞清楚了谁来买单,接下来的问题是,如何把钱赚到手?

在C端市场,赚钱靠应用。

这波大模型浪潮中,最早在C端赚到钱的公司,是上文提到的Jasper。

Jasper的业务建立在OpenAI的平台上。它打了一个时间差——第一批参与了GPT-3的小型内测,拿到API接口,在ChatGPT之前上线了产品。

文案写作是一个需求明确的市场,用AI生成文案,只要效果比人好,就会有人买单。Jasper的用户中一度有超过四分之三的人每个月支付80美元甚至更多,来获得各种写作模板套件。它在2021年的收入超过给它提供底层技术的OpenAI。

这给了行业启发。美国有非常多创业公司,调用大模型的API来打造新的应用,最火爆的是AI对话机器人和Midjourney这类AI图像生成产品,在应用商店分别贡献了49%、31%的下载量。

于是在美国,一度形成了基础大模型很难赚钱,而上层应用轻松赚钱的局面。有人在今年6月统计了全球月访问量最高的50个AIGC网站,发现名单上90%的应用有收入,几乎所有公司都采用订阅制。

不过,这条路在国内尚未完全走通。

国内竞争最激烈的战场在基础大模型,“百模大战”打的是通用大模型,而不是应用。

收费9块9的妙鸭相机,7月短暂火过一阵。3月就上线的文心一言,直到11月才开启订阅收费。而据Sensor Tower数据,2023年上半年,美国市场贡献了55%的AI应用总收入,欧洲市场占20%,包括中国在内的其他市场,加起来只占比25%。

原因有很多,比如中国的基础大模型起步较晚,应用层发展所倚赖的条件仍不成熟;中国面向消费端的应用付费意愿不强;另外AI生成的内容不可控,必然面临监管——9月初国内才开放第一批大模型备案,此前都只能内测。

智谱AI CEO张鹏说,在中美市场环境差别下,大模型企业的机会还是在企业端的垂类应用。

做B端市场,离钱最近的是做行业大模型。

用大模型给零售、金融、制造等领域进行智能化升级,是大部分国内企业认可的一条路。发布大模型较晚的腾讯、华为、京东,都在力推行业大模型。

这基于一个共识:用行业数据对通用大模型进行精调形成的行业大模型,在特定领域的表现会更好。

国内的互联网大厂从基础大模型做起,搭配行业大模型,抢占各大垂直行业。比如华为发布盘古大模型后,很快就在金融、制造、矿山、气象等垂直领域布局了垂直大模型,形成广泛覆盖。

有能力自研通用大模型的互联网大厂,更倾向于跟自己的云业务结合,对产业进行渗透,赚钱方式更多样。

百度、腾讯、阿里、华为等云厂商,在自己的云平台上搭载多个大模型(包括自研的和第三方的模型),然后把模型、算力、工具打包,以AI开发平台的形式对外提供服务。

他们就像开商场的,把场地、水电、设备等基础设施准备好,让商家(开发者、企业)进来开店,对商家提供服务并费用。同时,他们自己也会开店。

比如百度的文心千帆大模型平台,企业可以在平台上选择基座大模型,调用各种工具,在云端做推理、微调及托管,生成自己的大模型,然后定制化开发产品。这种方式比单纯调用API接口更能绑定客户。

为了打影响力,吸引客户,有一些厂商会将自己的大模型开源,然后用闭源大模型商业化。典型的如百川智能、智谱AI、阿里。

百川智能前期推出的几款大模型都是开源,免费可商用。赚了一波吆喝后就推出了两款闭源大模型,参数量更大,性能更强,面向B端开放API接口,开启变现。

这跟化妆品试用装的套路有点像,试用装免费,商业版收费。“另外它可能透露配方,如果有厂商想基于这个配方去创造一个新的产品,就需要交授权费。”人工智能公司开放传神(OpenCSG)创始人、CEO陈冉说。

三、谁在赚钱?

大模型公司都想向外界证明自己具备赚钱能力,实际上,把钱赚到手的公司不多。

根据OpenAI最新透露的信息,ChatGPT的周活用户数达到1亿人,有200万开发者正在使用OpenAI的API接口,92%的财富500强公司正在使用OpenAI的产品搭建服务。B端C端双管齐下,让它今年的收入或将超过13亿美元,远超去年的几千万美元。不过,在高额的研发投入和算力开支之下,OpenAI依然亏损。

好在它能通过技术迭代不断缩减成本。3月1日发布的GPT-3.5 Turbo模型,API的价格比GPT-3.5模型便宜10倍,8月它又通过提高每次API调用的速度,间接降低了调用成本。最新推出的GPT-4 Turbo,定价整体要比GPT-4降低超过2.75倍。

很多公司学习OpenAI。OpenAI的劲敌Anthropic推出付费版的Claude Pro,每月收取20美元(与ChatGPT Plus价格一样);百度推出文心一言付费版也是想在C端变现。

C端变现得有规模。底层算力成本高,导致产品一定要上量。在国内,还没有出现真正意义上的爆款应用。这意味着,移动互联网的盈利模式——C端赚关注、B端赚广告,尚无法成立。

相比AI聊天,办公软件是目前盈利模式最清晰、大厂布局最多的场景。

向OpenAI投资了100多亿美元的微软,已经把ChatGPT功能嵌入到工作协同软件Teams、必应(Bing)搜索引擎、Edge浏览器、Office办公套件Copilot,打造AI时代的办公全家桶。

这为微软带来了新的创收机会。由ChatGPT加持的Teams每月收费7美元,Office 365 Copilot每月收费30美元,目前已有100万用户为嵌入AI的Copilot功能付费。面向B端的商业版也在11月上线。市场预计微软接下来的营收还会大幅跃升。

钉钉在国内快速跟进。在阿里集团内部,钉钉是通义千问大模型最早的落地场景,群聊、文档、视频会议、应用开发等功能纷纷跟大模型结合。然后钉钉开始面向企业收费,不同方案在原有年费的基础上加价数万元不等。

金山办公也宣布WPS以API调用的形式接入了百度、智谱AI、Minimax三家公司的大模型,上线文字缩写、扩写、改写,自动生成文档等功能。暂时先免费,明年可能会收费。

这些产品并非全新物种,只是对原有产品的升级改造。钉钉跟微软Teams相似,WPS跟office相似,它们都是将大模型功能嵌入原有产品线,提高变现能力。用邱懿武的说法,这一轮AI大模型的本质是换引擎,把AI内置后赋能各项业务。

但在国内,不论个人还是企业,一旦涉及到付费,就非常考验其对产品的粘性。

秘塔科技CEO闵可锐认为,很多公司并不愿意为单纯具备管理职能的软件每年支付上万元,相比之下他们更看重能否带来可量化的新增用户。

所以类似钉钉这种定价模式,国内企业能否接受,仍需时间检验。

一位大模型领域的创业者对「定焦」说,现在的B端大模型产品还没有标准化,很容易做成高级的人力外包,太标准化就不够灵活。现阶段愿意买单的还是一些家底厚、想要拥抱新技术的中大厂。

四、能赚多久?

在一个行业爆发的早期阶段去谈论赚钱,或许是奢侈的。因为游戏规则可能一夜之间被改变。

Jasper曾在市场上非常火爆,赚钱能力让业内眼红。去年10月,它完成一笔1.25亿美元的融资,估值高达15亿美元。

一个月后,OpenAI推出ChatGPT,免费使用,效果让人惊艳。这让Jasper非常尴尬,价值迅速被摊薄。朱啸虎曾表示,Jasper或将很快归零,根本守不住。

当OpenAI亲自下场做应用,那些调用它的API做产品的公司,如果产品雷同,则可能被迅速替代掉。前几天OpenAI召开首届开发者大会,宣布推出GPTs和Assistants API,把很多开发者之前干的活替代了。

小冰公司CEO李笛认为,大模型API公司对创业团队的威胁很大,它们自然会把触角伸到下游应用层,跟“客户”形成竞争关系。

邱懿武也很早就意识到,在AI行业创业,总有一天会面临大厂的竞争和威胁。面向C端做一款AI工具,或者面向B端做服务,都无法构建壁垒。“工具很容易被复制,做到最后只能成为大厂生态的一个环节。”他说。

造物云已经拿下星巴克、海尔、苏泊尔等客户,产生了稳定的收入。但他认为如果要将这门生意做长久,未来一定得做平台。“上游对接开发者,下游对接客户,这样才有护城河。”

国内的很多大模型厂商将行业大模型视为商业化的突破口,行业里的公司则大部分处于观望状态,尤其是中小型公司,对付费比较谨慎。

一家做系统集成公司的员工对「定焦」说,他们很早就接入了百度的千帆大模型平台,可以免费调用平台的大模型能力,也可以开发部署自己的行业大模型。“如果一开始就要收费,那我们可能不会使用,毕竟现在有很多开源方案可以参考。”

大模型公司要赚钱,根本还是要给行业里的企业带来增量价值。不论是用AGI的推理能力重新组织业务的关键流程,还是重构产品形态和人机交互,最终的目的都是提高生产力。首先让企业赚到钱,大模型公司才能跟着受益。

这一切建立在技术足够成熟稳定的前提下,现在显然还不够。大模型公司还没有真正落到产业里去,技术跟企业应用的实际需求之间有鸿沟。“就像一个大学刚毕业的人,基本素养很好,但专业素养不够,还在实习,没转正。”邱懿武评价。

他举了个例子,有些厂商去给企业做项目介绍,PPT上展示的案例都很惊艳,但实际落地有很大偶然性。比如AI生成一张产品展示图,PPT里展示的那10张,可能是从100张中挑出来的。“这就像引擎还没定型,输出不稳定。”

即便如此,大家还是在积极争夺客户。一方面要抢占赛道占坑,另一方面需要从行业公司学习行业knowhow,以此迭代模型能力。

综合来看,大模型技术在快速进化之中,商业模式、行业竞争都未成定局。但商业化的进程已经启动了,有一些公司跑到了前面,还有一些公司刚刚开始。

欢迎免费使用GPT对话,感受ChatGPT的魅力! – 最具实力的中文AI交流社区平台 (aiahz.com)

ChatGPT国内版本,无需梯子,也能体验Chatgpt- (aiahz.com)

长按扫描二维码进群领资源

OpenAI|ChatGPT新功能,搜索Bing获取答案插图3

清华大学向量数据库最新综述!

以下文章来源于向量检索实验室 ,作者向量检索实验室-公众号:向量检索实验室

清华大学向量数据库最新综述!插图

论文下载链接:https://arxiv.org/pdf/2310.14021.pdf

摘要

大模型的场景下,需要越来越多的非结构化数据。而如何提供更可靠、安全、快速的查询处理能力,是当下各种VDBMS(vector database management systems)主要做的工作。本篇综述提供了一个全面的调研来评估这些技术和系统。本文的主要结构由下图所示,同时文章提出了 VDBMS 搭建过程中最重要的五个问题分别是:

(1) 模糊的搜索标准。结构化查询使用精确的布尔谓词,但向量查询依赖于难以准确捕捉的模糊语义相似性概念。

(2) 更多代价的的计算。属性谓词(如 <、>、= 和 ∈)大多可在 O(1) 时间内计算,但相似性比较通常需要 O(D) 时间,其中 D 是向量维度。

(3) 内存消耗大。结构化查询通常只访问少量属性,因此可以设计高效的存储结构,如列存储。但向量搜索需要完整的特征向量。向量有时甚至跨越多个数据页,使得磁盘检索效率更低,同时也增加了内存压力。

(4) 缺乏结构。结构化属性主要是可排序或顺序排列的,可通过数字范围或类别进行分区,从而用于设计搜索索引。但矢量没有明显的排序顺序,也不是顺序性的,因此很难设计出既准确又高效的索引。

(5) 与属性不兼容。对多个属性索引的结构化查询可以使用简单的集合操作(如联合或相交)将中间结果收集到最终结果集中。但向量索引通常会在找到 k 个最相似的矢量后停止,并将这些向量与结果集结合起来。

清华大学向量数据库最新综述!插图1

查询处理

在向量检索领域,通常使用距离来度量相似度。距离函数则服从度量公理即恒等式(d(a,a)= 0)、非负性(如果a != b,则 d(a,b)> 0)、对称性(d(a,b)= d(b,a))和三角不等式(对于任意三个向量a,b,c,d(a,c)≤ d(a,b)+d(b,c))。通常 VDBMS 中支持以下距离度量方法。

清华大学向量数据库最新综述!插图2

有时,真实世界实体由向量集合中的多个向量表示。例如,对于面部识别,面部可以由从不同角度拍摄的多个图像表示,从而产生 m 个特征向量 x1。..xm。给定一个查询向量 q,找到与 q 最相似的向量集合称为多向量搜索。解决这个问题的一种方法是使用一个总分数,它定义了如何将各个分数组合起来以产生可以比较的单个值。具体方法包括聚合或取平均等。

总结:

到目前为止,还没有指导分数选择的原则,因此,分数选择往往更多地基于从经验中提炼出来的非正式规则,而不是严格的理论。许多 VDBMS 都将距离的选择权交给用户,如何支持自动分数选择仍然是一个待解决的问题。最近的一项工作,根据社交媒体内容推荐的查询动态调整分数。更严格来说,向量搜索不仅受到相似性分数的影响,而且还受到 embedding 的性质和查询的语义的影响。因此,本文设想未来的解决方案将更加全面,除分数选择之外的各个方面统筹起来考虑这个问题。例如,EuclidesDB 允许用户在多个嵌入模型和分数上进行相同的搜索,以选择最有语义意义的设置。


ANN

近似最近邻检索,找到一个大小为 k 的子集 S′ ∈ S,使得对所有 x′ ∈ S′,d(x′,q)≤ c(minx∈S d(x,q))。如果 k = 1,我们称这个查询为近似最近邻搜索。当 c = 1 时,我们称之为精确查询。c = 1,k = 1 的情况对应于最近邻搜索,并且当 c = 1,k > 1 时,查询被称为 k-最近邻(k-NN)查询。

范围查询

范围查询由半径 r 来决定召回,而不是要返回的邻居数。

谓词查询

在谓词搜索查询或混合查询中,每个向量都与一组属性值相关联,并且这些值上的布尔谓词必须为结果集中的每个记录求值为 true。下面是一个例子:

清华大学向量数据库最新综述!插图3

在这个例子中,d 是一个由查询 q 参数化的距离函数,结果集中的每个成员都必须满足在 k 个最近的成员中并且服从谓词 attr < c 的条件。

批查询

对于批处理查询,同时向系统提交多个查询,并且 VDBMS 可以以任何顺序回答它们。这些查询特别适合于硬件加速的查询。

多向量查询

一些 VDBMS 还通过聚合函数支持多向量搜索查询。有三种可能的子类型:在多查询单特征(MQSF)查询中,查询由多个向量表示,真实世界的实体由单个特征向量表示;在多查询多特征(MQMF)查询中,查询和实体都由多个向量表示;在单查询多特征(SQMF)查询中,只有实体由多个向量表示。

总结:

对一个 VDBMS 的搜索能力进行评估,通常需要评估查询精度和性能。为了评估准确性,经常使用精确度和召回率。精确度被定义为结果集中相关结果的数量与结果集大小之间的比率,召回率被定义为检索到的相关结果的数量与所有可能的相关结果之间的比率。为了评估性能,使用延迟和吞吐量。延迟是 VDBMS 在收到查询后应答查询所需的时间,而吞吐量是单位时间内应答的查询数量,通常用 QPS。

原生的 VDBMS 和基于 NoSQL 的 VDBMS 倾向于依赖于 API。例如,Chroma 提供了一个只有九个命令的 Python API,包括添加,更新,删除和查询。另一方面,在关系型数据库基础上构建的扩展 VDBMS 倾向于利用 SQL 扩展。例如在 pgvector 中,k-NN 或 ANN查询表示为:

清华大学向量数据库最新综述!插图4

语法 R <->s 返回 R 和向量 s 的所有元组之间的欧式距离,并且通过其他符号支持其他距离函数。如果在 items 表上创建了 ANN 索引,则如果使用该索引执行,则此查询将返回近似结果。类似地,范围查询使用 where 表示:

清华大学向量数据库最新综述!插图5

存储和索引

数据分区技术

  • 随机:旨在利用多个独立事件的概率放大,使索引能够更好地区分真正相似的向量和不相似的向量。
  • 学习分区:基于模型学习的能力旨在识别S的内部结构,以便它可以按照结构划分。这些技术可以是有监督的或无监督的。
  • 可导航分区:可导航索引不是固定在绝对分区上,而是设计成可以轻松遍历S的不同区域。

注意如果对数据的更新改变了数据的分布,那么基于数据依赖策略的索引最终可能会随着时间的推移而变得不平衡。在许多情况下,这只能通过重建索引来解决。

存储和索引技术

  • 量化:量化器将向量映射到更节省空间的表示上。量化通常是有损的,目的是最小化信息损失,同时最小化存储成本。
  • 磁盘驻留:与只最小化比较次数的内存驻留索引相比,磁盘驻留索引还旨在最小化检索次数。

一个特定的索引可能使用多种技术的组合,因此下面会根据索引的结构对索引进行分类,然后指出哪些技术在哪些索引中使用。有三种基本结构:

  • 表将 S 划分为包含相似向量的桶;
清华大学向量数据库最新综述!插图6
  • 树是表的扩展;
  • 图用虚拟边连接相似向量,然后即可遍历;
清华大学向量数据库最新综述!插图7

总结:

从下面的可以看出,HNSW 提供了许多更优的特性。它易于构造,可以更新,并支持快速查询。因此,它得到许多商业 VDBMS 的支持也就不足为奇了。存储成本可能仍然是非常大的一个问题,但有一些工作也在解决这个问题。当然在某些情况下,其他索引可能会更合适。对于批量查询或查询属于 S 的工作负载,KNNG 可能是首选,因为一旦它们被构造,它们可以在 O(1)时间内回答这些查询。KGraph 很容易构建,但 EFANA 更适合任何在线查询。对于在线工作负载,选择取决于几个因素。如果错误保证很重要,那么可以考虑基于 LSH 的索引或 RPTree。如果内存有限,则基于磁盘的索引(如 SPANN 或 MANN)可能是合适的。如果工作负载是 write-heavy 的,那么基于表的索引可能是首选,因为它们通常可以有效地更新。其中,E2LSH 是数据独立的,不需要重新平衡。对于 read-heavy 的工作负载,树或图索引可能是首选,因为它们通常提供对数搜索复杂度。

除了这些索引之外,一些工作还混合结构以实现更好的搜索性能。例如,NGT 索引使用树来初始划分向量,然后在每个叶节点上使用图索引。

清华大学向量数据库最新综述!插图8

优化和执行VectorSearch

可以有多种方式来执行给定查询。查询优化器的目标是选择最佳查询计划,通常是延迟最小化计划。要实现此目标,第一步是计划枚举,然后是计划选择,最后是查询执行。对于谓词查询,向量索引不能很方便的与同一计划中的属性过滤器组合,这就需要开发新的混合运算符。

混合运算符

谓词查询可以通过在向量搜索之前应用谓词过滤器来执行,称为“预过滤”;在搜索之后,称为“后过滤”;或者在搜索期间,称为“单级过滤”。

如果搜索是使用索引实现的,那么需要有一种机制来通知索引某些向量被过滤掉了。对于预过滤,块优先扫描的工作原理是在进行扫描之前“屏蔽”索引中的向量。扫描本身正常进行,但只在非阻塞向量上进行。对于单级过滤,访问优先扫描的工作原理是像正常情况一样扫描索引,但同时根据谓词条件检查每个访问过的向量

计划枚举

由于向量检索来说往往由少量运算符组成,因此在许多情况下,预定义查询计划不仅可行而且高效,因为它节省了在线枚举计划的开销。但对于旨在支持更复杂查询的系统,计划无法预先确定。对于基于关系型数据库的扩展型 VDBMS,可以使用关系代数来表示这些查询,从而允许自动枚举。

预定义

对于预定义计划,主要考虑的是为哪个查询指定哪个计划。有些系统以特定工作负载为目标,因此每个查询只关注一个计划。其他系统则包含多个计划。

  • 单一计划:单一计划可以非常高效,因为它除了枚举之外还减少了计划选择的开销,但是如果预定义的计划不适合特定的工作负载,则可能是一个缺点。
  • 多计划:对于非谓词查询,不同的索引会有多个计划。例如,AnalyticDBV 支持基于 PQ 或 VGPQ 的暴力扫描和基于表的索引扫描。这允许使用这两种方法中的任何一种来执行 k-NN 查询。

谓词查询可以通过预过滤、后过滤或单级过滤来查询。但是不同的向量搜索索引,再加上属性索引的存在与否,会使可能的计划的数量会成倍增加。

自动枚举

对于自动枚举,一些基于关系型数据库的 VDBMS 利用底层关系优化器来执行计划枚举和选择。例如,pgvector 和PASE 都利用了 PostgreSQL 对用户扩展的支持。

计划选择

  • Rule Based:如果计划的数量较少,则可以使用基于规则来决定执行哪个计划。下图显示了 Qdrant 和 Yahoo Vespa 使用的两个示例。
清华大学向量数据库最新综述!插图9
  • Cost Based:还可以使用成本预测来进行执行计划的选择,选择具有最小估计成本的计划。在 AnalyticDB-V 和 Milvus 中,cost 模型将各个运算符的预估成本相加,以产生每个计划的成本预测。运算符的预估成本取决于距离计算的数量以及运算符执行的内存和磁盘检索。对于谓词查询,这些数字是根据谓词的选择性估计的。但是它们也依赖于所需的查询准确性,这是作为一个可调整的参数向用户公开的。离线确定不同精度水平对运算符开销成本的影响。

查询执行

硬件计算

  • CPU Cache

如果数据不在处理器缓存中,则必须从内存中检索,从而导致处理器阻塞。如下图 所示,Milvus 通过将查询划分为查询块,将成批查询的缓存缺失降到最低。查询一次回答一个块,多个线程可同时用于处理查询。由于每个线程在执行搜索时都会引用整个数据块,因此根据常见的驱逐策略,数据块不会被驱逐。

清华大学向量数据库最新综述!插图10
  • Single Instruction Multiple Data (SIMD)

原始 ADC 算法执行一系列表查找和求和。虽然 SIMD 指令可以简单地并行化求和,但查找需要内存检索(在缓存未命中的情况下),并且更难以加速。但是在一些工作中,SIMD 指令被巧妙地利用来在单个 SIMD 处理器内并行化这些查找。这种技术在 Faiss 中实现。基本思想如下图所示。查找索引加上整个查找表存储在 SIMD 寄存器中。然后使用 shuffle 操作符重新排列表寄存器的值,以便第 i 个条目包含第 i 个索引处的值,将随后的加法的值排列起来。

清华大学向量数据库最新综述!插图11
  • Single Instruction Multiple Data (SIMD)

GPU 由大量的处理单元以及内存组成。处理单元内的线程被分组在“线程束”中,并且每个线程束可以访问跨线程共享的多个32位寄存器。在一些工作中,给出了 GPU 的 ADC 搜索算法,也是 Faiss 的一部分。与 SIMD 算法类似,GPU 算法同样尝试避免内存检索,这次是从 GPU 设备内存中检索。它还通过在寄存器内执行表查找来实现这一点,利用称为“warp shuffle”的 shuffle 操作符。

分布式

分布式搜索许多 VDBMS 利用分布式集群来扩展到更大的数据集或更大的工作负载。一些云服务利用了分散的架构,以提供高弹性。

为了执行分布式搜索,首先将向量集合划分为多个分片。集合可以被划分为相等的分片,其中分片中的向量是相同分布的,或者基于其他特征来划分,例如基于使用基于表的索引分桶的集合的索引键。然后可以为每个分片构建本地索引,并且分片及其本地索引也可以被复制以提供容错并增加吞吐量,因为可以在副本上同时执行多个查询。

分布式向量搜索遵循分散-聚集模式。首先将查询分散到所有相关的分片,然后通过聚合每个分片的结果来获得结果集。例如,对于 k-NN 查询,每个分片产生一个结果集,其中包含查询的 k 个最近邻居,然后通过合并这些结果以产生最终结果集。

Out-Of-Place Updates

索引的更新问题也是大家比较在意的。如果采用立刻更新索引的策略会中断搜索查询。如果更新需要很长时间这些中断的后果可能会很严重。

  • 副本

复一些 VDBMS 通过将向量集合划分为分片和副本来缓解这个问题,然后在每个副本上构建本地索引。通过这种方式,如果一个副本上的索引正在进行更新或重建,则查询可以由其他副本处理,而不会造成任何中断。但是,存储(内存)需求乘以副本的数量,并且由于分散-聚集,搜索查询可能会有额外的开销。

  • Log-Structured Merge (LSM) Tree

另一种方法是将更新流到一个单独的结构中,然后在更方便的时候根据索引进行协调。LSM 树解决了读友好的索引不能支持快速写入的问题,而写友好的更新结构不能支持快速读取。在 Milvus 和 Manu 中,在 LSM 树的每个片段上构建向量搜索索引,以支持快速读取。每当段变满或合并时,都会创建一个新索引。

  • 其他技术

在 Vald 中,更新被流式传输到一个简单的队列中,然后在队列满了或基于其他条件时批量加入到本地索引。类似地,在 AnalyticDB-V 中,更新保存在内存中,并定期与磁盘上保存的旧记录合并

系统

原生系统

原生系统的特点是通过查询API、由少量组件组成的简单处理流程和基本存储模型。

Mostly Vector

  • EuclidesDB
  • Vald
  • Vearch

Mostly Mixed

  • Milvus & Manu
  • Qdrant
  • NucliaDB and Marqo
  • Weaviate

扩展系统

在传统的数据库上扩展向量检索。

NoSQL

  • Vespa
  • Cassandra
  • Databricks

Relational

  • SingleStore
  • PASE
  • Pgvector
  • AnalyticDB-V
  • ClickHouse and MyScale

检索引擎或库

  • 检索引擎

搜索引擎。Apache Lucene 是一个可插入的搜索引擎,为嵌入式应用程序提供了复杂的搜索功能。最新版本提供矢量搜索,由 HNSW 支持。虽然 Lucene 本身缺乏更高级别的功能,如多租户,分布式搜索和管理功能,但其中许多都是由构建在 Lucene 之上的搜索平台提供的,包括 Elasticsearch,OpenSearch 和 Solr 。这些功能可以使 Lucene 成为大多数矢量原生 VDBMS 的有吸引力的替代品,因为它提供了类似的功能,并且可以很容易地与现有基础设施集成。

有一些库直接实现了特定的索引。例如,KGraph 是 NN-Descent KNNG 的实现。微软的空间划分树和图(SPTAG)库将包括 SPANN 和 NGT 在内的多种技术结合到一个可配置的索引中。LSH 的库也可用,包括 E2 LSH 和 E2 LSH。同样,Meta Faiss 提供了一系列索引,包括 HNSW、汉明距离的 LSH 家族和基于量化的索引。

  • 其它系统

Applureform 是一个针对数据集管理的中间件。与关系 ETL 工具类似,它提供了一种组织工作流的方法,将原始数据源转换为由下游应用程序使用的数据集。Applureform 通过其 API 公开了其中一些下游函数。例如,它提供了一个向量搜索端点,该端点通过已配置的提供程序(如 Pinecone)执行 k-NN 查询。另一方面,Activeloop、Deep Lake 直接在向量仓库上提供向量操作,使其能够在仓库内执行向量搜索。

总结:

这些数据库的设计涵盖了涉及查询处理和向量存储的一系列特性,表现为一系列性能和功能,如下所示。本文提出几点笼统的意见。原生的大多数向量系统广泛地提供高性能,但针对特定的工作负载,有时甚至是特定的查询,具有相对有限的能力。同时,原生的大多数混合系统提供了更多的功能,特别是谓词查询,一些如 Milvus、Qdrant 和 Manu 也执行查询优化。扩展的 NoSQL 系统,在高性能和搜索能力之间实现了比较好的平衡。另一方面,扩展关系型数据库提供了最多的功能,但性能可能较差。但是,正如在其他地方提到的那样,关系型数据库已经是工业数据基础设施的主要组成部分,能够在不向基础设施引入新系统的情况下进行向量搜索是一个引人注目的优势。

清华大学向量数据库最新综述!插图12

在论文 Approximate nearest neighbor search on high dimensional data — Experiments, analyses, and improvement 中,大量的 ANN 算法在一系列实验条件下统一实施和评估。这些算法包括 LSH、L2H、基于量化的方法、基于树的技术和基于图的技术。实验在18个数据集上进行,从几千个向量到1000万个向量,维度从100到4096。这些特征向量来源于真实世界的图像、文本、视频和音频集合,以及合成生成的。算法是根据查询延迟以及基于精度、召回率和其他两个衍生指标的结果集质量来衡量的。在论文 ANN-Benchmarks: A benchmarking tool for approximate nearest neighbor algorithms 中,评估扩展到包括完整的 VDBMS。

  • 相似性评分的选择问题

不同相似度分数的语义质量仍然难以理解,并且对于如何为哪些场景选择哪个分数没有严格的指导。像EuclidesDB这样的系统可以用于实验性地确定最佳得分和嵌入模型。

  • 运算符的设计

设计高效和有效的混合运算符仍然具有挑战性。对于图索引,块优先扫描可能会导致图断开连接,这些组件要么需要修复,要么需要新的搜索算法来处理这种情况。现有的离线阻塞技术仅限于少量属性类别。对于访问优先扫描,由于不可预测的回溯,估计扫描的成本是具有挑战性的,使计划选择复杂化。

  • 增量搜索

一些应用程序,如电子商务和推荐平台,使用增量k-NN搜索,其中k实际上非常大,但以小增量检索,以便结果看起来无缝地交付给用户。虽然存在这种类型的搜索技术,但目前还不清楚如何在向量索引中支持这种搜索。

  • 多向量检索

多向量搜索对于某些应用(如人脸识别)也很重要。现有技术倾向于使用聚合分数,但这可能是低效的,因为它会增加距离计算的数量。通用的多属性topk技术也很难适应向量索引,并且没有关于MQMF查询的工作。

  • 安全和隐私

随着向量搜索变得越来越关键,数据安全和用户隐私变得越来越重要,特别是对于提供托管云服务的VDBMS。因此,需要能够支持私有和安全的高维向量搜索的新技术。

在本文中,总结了向量数据库管理系统,旨在快速,准确的进行向量搜索,开发更实用的应用程序,如 LLM 应用。我们回顾了查询处理过程中的所有注意事项,包括相似性分数,查询类型和基本运算符。还回顾了关于向量搜索索引的设计、搜索和维护注意事项。我们描述了查询优化和执行的几种技术,包括计划枚举、计划选择、谓词或“混合”查询的运算符以及硬件加速。最后,本文讨论了几个商业系统和用于比较的主要基线。

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图

如果问今年谁是数字化市场讨论的中心,答案一定是ChatGPT。自动生成文案、绘画、翻译等一系列功能,为我们带来了不小的冲击。但是,如果你一直关注数字化,就会知道人工智能并不是个新鲜事,早在它之前,像如Sitecore这样的DXP平台,早已在应用这样生成式的AI助力企业数字化了。而毫无疑问的是,Sitecore的AI技术改变了企业营销的运行法则,将由人工智能驱动数字化提升到了新的高度。

“那么对于渴望用个性化留存用户的企业来说,更需要了解生成式AI的现在和未来会有什么发展,Sitecore这样以提供个性化体验闻名的平台是怎样用AI推动个性化的。”在互联网行业深耕多年睿哲信息敏锐地为我们指明了方向。

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图1

深入了解生成式AI,从过去到将来

在探讨生成式AI的过往和未来前,我们首先要了解什么是生成式的AI。

生成式人工智能(Generative Artificial Intelligence,简称生成式 AI)是一种基于机器学习和人工智能技术的范畴,其目标是让计算机系统能够自主地生成各种类型的数据,如文本、图像、音频等,而不仅仅是对已有数据的模仿或分类。生成式 AI 的核心能力在于创造新的内容,而不仅仅是对已知模式的重复应用。其中,生成式人工智能模型是生成式 AI 的重要组成部分,而 ChatGPT 就是其中的一种代表性模型。

在早期的迭代中,人工智能投入是应用是通过收集和解释行为数据来预测消费者的偏好,然后给出符合这些数据的内容建议,另一大关键作用就是被用来增强搜索引擎,通过了解搜索词背后的意图和上下文,为用户提供更相关的搜索结果。

最近,人工智能已被用于虚拟聊天机器人自动生成对常见查询的响应,并解释关键字以形成可能的答案。它为品牌提供了部署更高级聊天机器人的能力,这些聊天机器人经过比以往任何时候都更大的数据集训练。这些都有助于为营销人员产生新的见解,为客户带来更好的结果,提供深入相关的内容,增强客户正在寻找的个性化体验。

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图2

想尽快追上AI的脚步,需要灵活应用组合性的力量

但是同样的这里就产生了问题,并不是所有的营销人员都体会到了这种人工智能带来的美好变化,近一半(45%)的人认为他们的营销技术目前没有能力使用生成人工智能他们需要灵活的解决方案,使他们能够快速有效地做出响应。

对于希望提供出色客户体验的品牌来说,在当下没有比生成式 AI更好的选择了。它比以往任何其他的方式都更有可能接近客户,更有助于大规模地提高效率、带来个性化的内容和营销。而传统解决方案想当然的是无法满足这样的期待的,所以我们需要可组合的解决方案,

需要灵活的与现有的开放式的API大规模的集成部署,将新的创新无缝集成到营销技术堆栈中,快速地对不断变化的客户需求和技术趋势做出回应,而就眼下来说,Sitecore无疑就是那个推动我们快速实现智能化的选择。

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图3

人工智能的当下,我们需要Sitecore

我们之所以如此沉迷于人工智能,更多的是因为它给予了我们一种关于自动化的想象。而这个自动化可以帮我们实现大规模的个性化,让我们更加透彻的了解客户、服务客户,从而自动地得到好的市场反馈,这些也正是Sitecore AI正在帮我们做的。

Sitecore AI与Sitecore XP和Sitecore Content Hub集成,创建了一个强大的个性化引擎;

1、Sitecore AI创造更详尽的用户洞察

Sitecore AI分析访客的行为和特征,构建详细的客户画像。这些洞察力使品牌能够识别趋势、细分受众,并确定每个访客在其旅程中的位置。这种上下文对于提供推动访客前进的个性化内容至关重要。

2、Sitecore AI带来量身定制般自动匹配

自动个性化功能利用这些画像自动将访客与量身定制的内容和优惠匹配。现在,品牌可以在没有手动个性化的情况下为访客提供相关体验。人工智能在幕后完成工作。

3、Sitecore AI让内容制作更加简单

Sitecore AI还通过图像相似性简化了内容制作和策划。它扫描你的内容资产以查找视觉重复和相似之处。这样可以轻松重新利用内容,节省时间和精力。

4、Sitecore AI为营销人员提供更有吸引力内容

Sitecore AI也能够提供个性化推荐,通过透明的算法让营销人员尽情掌控一切,轻松的判断哪些内容更有吸引力,从而不断地优化客户体验并推动他们的最终转换。

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图4

睿哲信息:快速部署Sitecore AI,我们需要一个成熟的实施合作伙伴

根据相关的调查数据显示,超过一半(55%)的消费者今年减少了在非必需品上的支出,而这也决定了营销人员需要个性化体验上做更多的投资,来留住用户,这些无不都指向可以提供更深入个性化的Sitecore AI,而想要快速的拥有这一解决方案,我们需要一个像是睿哲信息这样成熟的实施合作伙伴。

超十五年、Sitecore5.0到Sitecore10.3全版本、为海内外多个大中型企业实施部署ditecore经验,都让睿哲信息更懂Sitecore,对于当下人们对于Sitecore的追捧,它表现的非常坦然:“线上信息越是繁杂,人们就越渴望个性化,这就要求企业跳脱出给用户提供一个网站思想层面,而是想办法为每一个用户提供针对性的网站浏览体验。在这样的背景下,能够提供深入的个性化体验的Sitcore大火那就是情理之中了。”

AI客服?AI个性化?早于ChatGPT,Sitecore AI早就在赋能数字化!插图5

而关于为什么一定要找一个成熟的合作伙伴,它也给出了自己的答案:“Sitecore的个性化,它的出色数字洞察,它的简单易用,都是建立正确快速部署它的基础上,它是一个组件众多、功能众多的综合性解决方案,合作伙伴不但要有一定的技术实力,还要有足够的经验,才能判断什么样的解决方案更合适用户,怎样让Sitecore发挥出更大的效力。”

欢迎免费使用GPT对话,感受ChatGPT的魅力! – 最具实力的中文AI交流社区平台 (aiahz.com)

ChatGPT国内版本,无需梯子,也能体验Chatgpt- (aiahz.com)

长按扫描二维码进群领资源

OpenAI|ChatGPT新功能,搜索Bing获取答案插图3

欢迎来到

我们旨在打造一个最具实力的中文AI交流社区平台,致力于为所有 ,创业者和使用者提供优质服务. 我们的宗旨是为广大用户提供免费解决方案,您可以通过问答形式提出与AI相关的任何问题.

AI社区 AI工具

安全服务战略合作伙伴:麒麟盾 SCDN

登录

找回密码

注册

Baidu
map