当前位置-->首页-->娱乐
改良土壤,守护粮仓。3月19日,镇雄县2025年生产障碍耕地治理项目在花山乡正式启动实施,通过科学增施有机肥改良土壤,让耕地重焕生机活力。
在项目启动现场,县农业部门工作人员围绕项目实施内容、重要意义向群众细致讲解,云南华联矿产勘探有限责任公司同步开展业务技术培训,并深入田间地头实地教学,重点示范讲解有机肥、土壤调理剂、叶面阻控剂的施用要点与操作方法,现场技术指导清晰实用。同时为群众免费发放有机肥160吨,切实把耕地改良举措落到田间地头。
据了解,镇雄县2025年生产障碍耕地治理项目为跨年度实施工程,覆盖全县11个乡镇18个行政村,总实施面积达20058.21亩,其中花山乡实施面积7240.88亩,为全县项目覆盖面积最大的乡。作为全省粮食主产大县,镇雄县为本项目争取中央财政资金527万元,计划向项目区群众发放有机肥2977.716吨、土壤调节剂261.704吨,并由第三方专业机构喷施叶面阻控剂585.753升。
该项目由镇雄县农村能源建设与农业环境工作站牵头实施,结合当地耕作制度、气候条件、土壤特性及水利配套等实际情况,采取增施有机肥、施用土壤调理剂、喷施叶面阻控剂等综合措施,精准治理生产障碍耕地。
“按照技术规范科学施肥,能有效解决耕地肥力下降、土壤板结等突出问题,提升土壤有机质含量,改良土壤结构,恢复土壤生态功能,既保障农产品质量安全,也助力赤水河流域生态保护工作有序推进。”镇雄县农村能源建设与农业环境工作站工作人员成丹介绍。
无人机现场喷洒施叶面阻控剂。
为严把耕地投入品质量关,昭通市农业农村局对第三方配送的有机肥开展现场抽样送检,严格核查肥料成分标注真实性、指标合规性及产品质量达标情况,确保项目用肥安全有效。
按照项目实施计划,本次生产障碍耕地治理各项措施将于2026年6月底前全面落地,秋收时节由昭通市农业农村局通过农产品抽样检测,开展项目实施效果综合评估。
据了解,自2021年以来,生产障碍耕地治理项目已在镇雄连续实施四年,累计投入涉农整合资金614万元、中央资金2055万元,覆盖19个乡镇56个村10.5万亩耕地,耕地治理成效持续显现。下一步,镇雄县将以项目实施为抓手,结合生态效应评价与常态化土壤监测,建立生产障碍耕地治理利用长效管理机制和土壤环境保护科学管理体系,持续筑牢土壤安全屏障,全力保障农作物品质与粮食生产安全。
记者:陈忠华 通讯员:周洪 谢婧妍 文/图
中央资金527万元加持!镇雄县生产障碍耕地治理项目在花山乡正式启动
具体回答时,当用户用语音进行提问之后,页面中将呈现出AI根据真人经验整理出的总结答案,下方则出现“AI总结xx篇笔记生成”的标注。
比如,当界面新闻搜索“春节去哈尔滨玩5天有什么形成安排推荐?”的问题时,平台在10秒之内完成了AI总结,用较为清晰的文字排版呈现出5天的行程安排。除了行程安排之外,AI总结的答案还加上了“春节特别提醒”,涵盖交通、美食推荐等细化建议。而在收尾处,该答案也附上了参考来源,这些来源笔记皆可点开一一查看。
除此之外,小红书也会给出AI总结答案之外的大量笔记参考。在整个页面中,AI总结答案占据大约半屏左右的比例,需要点击后查看全部内容;而答案下方依然会呈现双列流笔记,内容与用户的提问紧密相关。
事实上,在AI应用爆发之后,“旅游攻略”这一类需要提供有用信息和干货的问题,往往成为最受用户欢迎的提问。小红书在这一点上能够提供大量的笔记参考,例如,在上述搜索下,页面出现的内容包括普通旅客、旅行社、导游和当地市民等用户发布的笔记,形式也涵盖图文和视频。
值得一提的是,小红书还在搜索入口下方推出了“春节指南”、“年度诗篇”等限定玩法,去引导用户在春节场景里尝试“语音问一问”。无论用户有没有问题,都可以通过点击提问来“逛答案”。
比如年夜饭灵感——在这一答案中,AI会总结出“怎么做出看起来很硬核但实际上很简单的菜”。
而另一类更具“生活感”、强调个体主观看法的问题,同样是符合小红书用户需求的提问。界面新闻试着使用“语音问一问”搜索“放假完不想上班怎么办?”的问题时,小红书结合了34篇笔记生成了一份AI总结,包括“调整心态”、“行动起来”、“如果真的无法忍受”等具体的答案。
对于这种颇具“活人感”的话题,这份总结给出的答案似乎更有小红书的特色,例如,在AI总结的答案中,提到了“想开点,钱最重要”这类像朋友对话般的回答;同样也提到了制定小目标这样具体的建议。在页面下方推荐的笔记中,界面新闻观察到,不少用户分享了自己摆脱“假期综合症”的方法和体验,也有不少用户分享了有关情绪管理的小tip,兼具个人体验和实用性。
体验完上述两个提问之后,关于小红书“语音问一问”的功能特质也更加明了。
在中文互联网社区,“问答类”的产品早已不是全新概念。最早它往往作为搜索引擎的补充出现,旨在解决用户具体的问题;之后其发展成更具社区和互动属性的问答,但往往也有中心化的特征。
AI的出现,让“语音问一问”这一功能有了更多延伸的可能。
截至2024年末,小红书月活用户突破3.5亿。此外,小红书又是一个典型的UGC平台,大量的“活人经验”让平台有了天然的“答案库”。
从上述搜索体验来看,小红书语音问一问给出的答案全部基于站内真人经验总结而成,相当于“浓缩”了真人经验分享。
正是依托于天然的“答案库”,小红书的“语音问一问”才得以实现相对独特的体验。
AI时代的新产品
ChatGPT和DeepSeek的横空出世让不少社区产品被动加快追赶的脚步,但AI的可复制的“标准答案”与小红书的“活人感”社区之间乍一看显得格格不入。
然而就是在这“碰撞”之中,小红书近期交出了第一份尝试的答卷——“语音问一问”功能上线半个月,社区语音问一问累计次数达4800万次,平均每秒钟都有37个人在线蹲答案。除夕当天“拜年祝福怎么发更特别”被问了570万次。
图片来源:《小红书2025年十大搜索趋势报告》
那么小红书为何要推出“语音问一问”呢?
这还要从平台本身的属性上说起。在产品形态上,小红书坚持双列瀑布流的信息展示方式,去中心化的推荐设置也让更多来自于普通人的笔记被曝光、被看见。在用户心智上,小红书涉及的类目越来越多,用户如今普遍将平台视作一个获取真实生活经验、决策参考和信息交流的重要来源,普通用户之间的交流也十分频繁。
据媒体报道,如今小红书用户的日均搜索次数已经超过7亿次。根据《小红书2025年十大搜索趋势报告》,2025年全年搜索总次数2500亿次,问题垒起来相当于5500万本《十万个为什么》。
可以说,现阶段这一产品功能的更新,也是为了满足当下小红书用户的搜索新需求:从最早的消费决策满足到干货信息的延伸,如今,越来越多的用户希望在小红书上找到更进一步的具体经验分享、更全面的“有用”回答以及更具启发性的个性化经验。
2025年年末,小红书社区内出现过“AMA”的风潮——“Ask me anything”,一种发帖人对提问者“有问必答”的玩法。几个月时间里,AMA在小红书扩散,不仅吸引了李开复、李银河、罗永浩等名人下场参与,也让这股全民问答风潮,成为一种新的互联网现象。
AMA的爆火,恰恰说明,用户如今在小红书上的经验需求,已经从生活场景“破圈”延展到了知识、科技、人文等细分领域。
再往前追溯,小红书其实早已尝试过在评论区、搜索框右侧等端口上线“问一问”功能。
类似这样的趋势和尝试,为“语音问一问”的推出埋下伏笔。
需求明确之后,交互方式的选择就涉及如何最大限度容纳用户需求匹配的问题。
一方面,语音提问是一种更顺畅表达问题的方式,某种程度上有利于用户降低提问与搜索的门槛;另一方面,“提问”是一种承接、解决问题的方式,它传递出的信息是,只要用户提出问题,就会有笔记能够“回答”。
事实上,相比其他搜索产品,足以覆盖极广泛、细分经验场景的UGC真实内容,一直是小红书搜索的核心护城河。即使是某一个景点的当日天气,或者某一家餐厅的wifi密码,这样细颗粒度的问题,在小红书上都有笔记答案。
但小红书内部人士表示,他们观察的一个现象是,过往的搜索框中较短的词语占据了70%到80%的比例,这意味着要让用户更具体地表达提问,并匹配准确结果,单凭文字搜索+双列笔记承接并不容易。
而语音交互+AI总结无疑能进一步让这些真实、长尾的经验被最大限度地匹配——从调研来看,用户在语音这种环境下会更偏向于自然表达,也会提出一些更长的、更具体的、更明确的问题。而当问到长达几段的个性化问题时,问一问依然能够总结和匹配站内的经验笔记回答。
从早期的搜索补充到后期的独立产品,再到嵌入社区,“问搜”式的产品形态几经变化。如今,用户对于搜索功能的需求已经不只是单一的标准答案和知识满足,他们有了更多元的期待,同时也不再局限于文字的交互。甚至于,搜索功能未来也可能会深度融入小红书这样的内容平台,成为互动和内容生产的“基础设施”。
不过,纵观市面上的“问答”功能,大部分仍然聚焦在平台或内容生产者对于某一问题的解读上。
抛开形式上的特殊之处,小红书“语音问一问”的最大差异化体现在真实经验上。
举例而言,近两年小红书用户中对于家居家装内容保持高兴趣的用户已经达到1.6亿,这意味着平台聚集了大量和家居、装修有关的笔记。当界面新闻试着语音提问“家里装修是复古风格,适合放一些什么样的插画?”时,AI总结了71篇笔记生成了答案。除了建议不同风格之外,回答还给出了“温馨小贴士”,下方的总结多来自于不同用户分享的插画灵感。
从社区内容的活跃度来看,这样“问搜”的方式不仅提升了用户获取信息的效率,也同时保留了提问者和内容生产者之间的连接,甚至盘活了社区的流量。
以真实经验为基石,同时辅以AI技术,未来小红书的“搜索”心智或许也会迎来进一步迭代、泛化和巩固。
很长一段时间里,社区主要围绕人的连接和内容消费展开,但发展到今天,随着用户的需求日益多元,社区产品本身也需要寻找新的形态和创新路径。
与此同时,一个现象正在发生:人工智能技术的发展让用户逐渐习惯与AI对话,在高效寻找标准答案的背后,部分问题也呼之欲出——那些基于真实生活、富有个人感受的经验分享,正变得愈发稀缺。
可预见的未来里,人们或许不会满足于迅速获取一个“标准答案”,而是渴望看到他人的真实决策、试过的“错”,甚至在具体生活场景中的主观感受。
某种程度而言,这或许才是小红书“语音问一问”的宝贵价值——真人经验依然是社区最宝贵的财富,这条护城河在语音问一问AI功能的辅助之下,被更多的人看到、使用和认同,这或许才是产品升级的底层逻辑。
春节期间,引发用户自发分享的“年度诗篇”在社交媒体上刷屏,便是个例子。“年度诗篇”实际上是AI通过用户搜索行为洞察出的个人年度总结,其之所以能击中用户的内心,原因就在于AI用敏锐、细致、有温度的方式准确表达了每一个用户的真实搜索需求和意图,并且富有诗意地将其呈现出来。那些个性、差异、多元和细节,才最动人。
小红书“语音问一问”只是一个开始,它正在让人看到真人经验UGC社区更多的创造力和可能性。
推出语音问一问背后,小红书的“答案”逻辑变了?
本期公开课,雷锋网请到了图普科技机器学习工程师 Vincent 为大家揭开 AI 可以助你成为“画家”的秘密。 Vincent 曾在英国留学两年,回国后加入图普,担任机器学习工程师一职,参与图普多个产品的研发工作,立誓要搞深度学习搞到死。
嘉宾介绍:
Vincent,图普科技机器学习工程师,主要从事工业级深度学习算法的研发。曾任摩根大通欧洲技术中心分析师,IBM爱丁堡办公室软件工程师。熟悉自然语言处理(文本分类,语言模型等),图像转换(艺术滤镜、图片上色等)和分类算法。
以下内容章整理自公开课分享。
|深度神经网络在图像识别领域的进展
自从 2012 年 Alexnet 横空出世,一举夺得 ImageNet 图片分类大赛冠军之后,深度学习一飞冲天,以卷积网络为首的深度神经网络不断刷新各种计算机视觉任务的 State-of –the-art 。过去四五年间,我们可以看到学术界不断地开发出各种不同结构的卷积神经网络,而且,这些结构并不仅仅是在 Alexnet 的基础上加深层数,而是自成一派,各有所长。
本次公开课重点分享三种神经网络结构:
Network in Network(NIN,网络中的网络):卷积网络是一种线性操作,非线性的表现能力有限,NIN 的研发者设计了比起传统的卷积网络更复杂的操作 —— MLPconv,并用 Global average pooling 极大的改进了卷积网络的大小。VGG 和 GoogLeNet(inception_v1):二者是 2014 年 ImageNet 竞赛的双雄。VGG 的设计理念,全部都用了 3x3 卷积,增加了网络的深度。 GoogLeNet 属于Google 的 Inception 系列,用了比较花式的网络设计,旨在减少网络的运算量,加快训练 。Resnet(深度残差网络): 根据无限逼近定理(Universal Approximation Theorem),我们可以用一个一层的神经网络来实现任意的维到维的映射,但网络的参数量(网络的宽度)会随着问题复杂度的增加变得非常大,而增加网络的深度则可以让我们用更少的参数量实现同样的映射。但是,随着神经网络层数的加深,它们的训练也会变得越来越困难,因为在训练时会出现梯度消失的状况。Resnet 很好的解决了这个问题,让训练达1000多层的神经网络变得可能。
Network in Network(NIN,网络中的网络):卷积网络是一种线性操作,非线性的表现能力有限,NIN 的研发者设计了比起传统的卷积网络更复杂的操作 —— MLPconv,并用 Global average pooling 极大的改进了卷积网络的大小。
VGG 和 GoogLeNet(inception_v1):二者是 2014 年 ImageNet 竞赛的双雄。VGG 的设计理念,全部都用了 3x3 卷积,增加了网络的深度。 GoogLeNet 属于Google 的 Inception 系列,用了比较花式的网络设计,旨在减少网络的运算量,加快训练 。
Resnet(深度残差网络): 根据无限逼近定理(Universal Approximation Theorem),我们可以用一个一层的神经网络来实现任意的维到维的映射,但网络的参数量(网络的宽度)会随着问题复杂度的增加变得非常大,而增加网络的深度则可以让我们用更少的参数量实现同样的映射。但是,随着神经网络层数的加深,它们的训练也会变得越来越困难,因为在训练时会出现梯度消失的状况。Resnet 很好的解决了这个问题,让训练达1000多层的神经网络变得可能。
除了图片分类,以 RCNN 系列为首的神经网络技术在物体检测任务上也取得了重大进展,近年来也出现了速度更快(YOLO),效果更好的算法(SSD)。
最近很火的 GAN 是一个训练框架,在 GAN 出现之前, 生成模型的训练是一件相对较困难的事情,GAN 出现后,生成模型训练的效率大大提高。
GAN的应用大部分也是生成模型的应用,用来生成图片、音乐、文字等。但是对抗训练对训练判别模型也是有非常大的帮助的,因为虽然有非线性的激活函数,但深度网络依然是高度线性的,会对误差进行累积,累积的误差结果通过肉眼分辨不出来,但是可以从卷积网络中看出。但与普通线性模型不同,深度神经网络可以拟合对抗训练可以很好的解决这个问题,解决方式是生成对抗样本,使得网络对对抗样本的容忍性更强些。
GAN这一两年来产生了许多非常有意思的应用,其中包括上期公开课中冯佳时博士提到的超分辨率,旨在把低分辨率的图片放大,而尽量不让其清晰度受影响。
|纹理转换
近几个月比较火的纹理转换也就是所谓的图片风格化,在深度学习之前,这也是一个非常困难的问题。其本质原因在于之前非深度学习的方法只能获取到目标图片低层次的图片特征,这导致这些方法无法独立的对图片的语义内容和风格的变化进行有效地建模,从而无法很好地对两者进行解耦和合成。
风格化算法现在更迭了两代。
第一代风格化算法:Neural Style
2015年的时候,德国图宾根大学的学者们提出了一种用深度神经网络各层的响应来表达图片的风格和内容的办法,方法可概括为:
准备好在 ImageNet 数据集上训练好的 VGG 网络,然后选取其中的某些层作为风格语义的提取层,某些层作为内容语义的提取层;用这个训练好的 VGG 提取风格图片代表风格的高层语义信息,具体为,把风格图片作为 VGG 的输入,然后提取在风格语义选取层激活值的格拉姆矩阵(Gramian Matrix)。值得一提的是,格拉姆矩阵的数学意义使得其可以很好地捕捉激活值之间的相关性,所以能很好地表现图片的风格特征;用 VGG 提取被风格化图片代表内容的高层语义信息,具体为,把该图片作为 VGG 的输入,然后提取内容语义提取层的激活值。这个方法很好地利用了卷积神经网络的性质,既捕捉了图片元素的结构信息,又对细节有一定的容错度;随机初始化一张图片,然后用2,3介绍的方法提取其风格,内容特征,然后将它们分别与风格图片的风格特征,内容图片的内容特征相减,再按一定的权重相加,作为优化的目标函数。
准备好在 ImageNet 数据集上训练好的 VGG 网络,然后选取其中的某些层作为风格语义的提取层,某些层作为内容语义的提取层;
用这个训练好的 VGG 提取风格图片代表风格的高层语义信息,具体为,把风格图片作为 VGG 的输入,然后提取在风格语义选取层激活值的格拉姆矩阵(Gramian Matrix)。值得一提的是,格拉姆矩阵的数学意义使得其可以很好地捕捉激活值之间的相关性,所以能很好地表现图片的风格特征;
用 VGG 提取被风格化图片代表内容的高层语义信息,具体为,把该图片作为 VGG 的输入,然后提取内容语义提取层的激活值。这个方法很好地利用了卷积神经网络的性质,既捕捉了图片元素的结构信息,又对细节有一定的容错度;
随机初始化一张图片,然后用2,3介绍的方法提取其风格,内容特征,然后将它们分别与风格图片的风格特征,内容图片的内容特征相减,再按一定的权重相加,作为优化的目标函数。
保持 VGG 的权重不不变,直接对初始化的图⽚做梯度下降,直至目标函数降至一个比较小的值。
这个方法的风格化效果震惊了学术界,但它的缺点也是显而易见的,由于这种风格化方式本质上是一个利用梯度下降迭代优化的过程,所以尽管其效果不不错,但是风格化的速度较慢,处理一张图片在GPU上大概需要十几秒。deepart.io这个网站就是运用这个技术来进行图片纹理转换的。
第二代风格化算法:Fast Neural Style
有了可以解耦图片风格和内容的方式,我们就能训练一个端到端的网络,使得我们只需要做一次前向,就能得到风格化图片。因此生成图片大概的步骤是,根据转化的网络得到输出,输出至 VGG 网络,提取风格特征后,跟风格图片的特质做比较,内容图片的特征也会被提取,跟内容图片做比较。
这种算法的有点是速度快,可以在GPU上做到实时生成。去年年中火爆全世界的 Prisma,背后就是这个技术。但这个技术还是有缺陷的,比如由于卷积网络固有的性质,它无法像手动绘图一样对图片的细节进行精挑细选的处理,所以它像是一个豪放的印象派画家,对一些对细节要求比较高的任务,比如人物的动漫化,这种方式是不太适合的。
所以,前段时间⽐较流行的《你的名字》同款滤镜所用到的技术跟Prisma 并不一样,我们猜测这个滤镜不是端到端的,而是会先对原图做像素分割,找出可能是天空的部分,然后加上新海诚特色的云,其他部分则会做一些滤镜化处理。
纹理转换的另外一个非常有意思的应用是Neural Doodle,运用这个技术,我们可以让三岁的小孩子都轻易地像莫奈一样成为绘画大师。这个技术本质上其实就是先对一幅世界名画(比如皮埃尔-奥古斯特·雷诺阿的Bank of a River)做一个像素分割,得出它的语义图,让神经网络学习每个区域的风格。
然后,我们只需要像小孩子一样在这个语义图上面涂鸦(比如,我们想要在图片的中间画一条河,在右上方画一棵树),神经网络就能根据语义图上的区域渲染它,最后得出一幅印象派的大作。
大家如果有关注 AI 领域信息的话,可能也知道 Facebook 宣布了他们的 caffe2go 框架,并展示了他们在手机上的实时风格化视频,这项成果意义重大,主要体现在可以在手机端非常有效率的运行人工智能的算法,把有趣的人工智能技术实现到你的手掌心。例如现在直播或视频中可以在人脸上添加各种可爱小动物表情的技术也是人工智能的技术,其主要运用了人脸关键点检测技术。
实现视频风格化的难点在于:
像图像风格化这样的重型应用,如果要在手机上做到实时效果,需要有非常多工程上的优化和算法方面,在尽量不影响效果的前提下减少网络的参数量; ⽐起单图片风格化,视频风格化需要考量的东西会更多,单独对视频的每一帧进行处理,不考虑帧与帧之间的关联,会造成风格化的视频抖动和不协调。
像图像风格化这样的重型应用,如果要在手机上做到实时效果,需要有非常多工程上的优化和算法方面,在尽量不影响效果的前提下减少网络的参数量;
⽐起单图片风格化,视频风格化需要考量的东西会更多,单独对视频的每一帧进行处理,不考虑帧与帧之间的关联,会造成风格化的视频抖动和不协调。
|黑白照片上色
最后一个要介绍的技术为黑白照片上色(Colourful Image Colourization),想象一下,如果人工智能出色地完成这个任务,我们便可以用它来为老照片,老电影增色,轻易地为漫画上色了。本次公开课我会主要介绍去年 ECCV 里加州大学伯克利分校的一篇文章介绍的方法。这个方法与之前方法的不同之处在于,它把照片上色看成是一个分类问题——预测三百多种颜色在图片每一个像素点上的概率分布。这种方法tackle了这个任务本身的不确定性,例如,当你看到一个黑白的苹果时,你可能会觉得它是红色的,但如果这个苹果是青色的,其实也并没有多少违和感。大家也可以到作者的网站网站来试用他们的demo。
这篇文章里面介绍的方法有两个非常重要的trick:
颜色重平衡(Class rebalancing)
我们都知道,各个颜色在全世界所有彩色照片里面的分布是不一样的。比如,大部分照片里面可能会有天空,墙壁,草地等。论文作者给出了 ImageNet 数据集中颜色的分布,可以看出,如果用 LAB 的方式来表示图片(L 通道为像素的亮度,AB 通道表示颜色),ab 值比较低的颜色出现的频率远高于其他颜色。
如果不考虑这个问题,我们的目标函数会对 ab 值⽐比较高的颜色极其不敏感。所以,论文作者提出了了一种方法——在训练时让每一个像素点乘上一个系数,系数的大小与该像素点 ab 值的分布有关。运用这个trick,输出图片的颜色会更有多样性,更接近真实的图片。
从概率分布得出预测颜色值(Point estimate)
我们知道,这个网络的输出是各个像素点ab值的概率分布,那么我们如何去通过这个概率分布得出这个ab值呢?当然,我们可以直接选择概率最大的值作为我们的 prediction,这种做法下输出图片的颜色会更加鲜艳,但很多时候会有不自然的patch出现。另外一种做法是,取这个概率分布的均值作为prediction,这会导致我们的输出图片对比度非常低。作者在这篇文章里提出了一个折中的做法:我们可以调整Softmax 函数的 temperature,然后再求新的概率分布的均值。
这篇文章介绍的方法虽然效果很好,但它还是有缺陷的。比如,对狗的图片上色时,即使它没有伸出舌头,神经网络总是会“想象”它伸出了,然后在鼻子下面的一小块区域涂上红色。而且,上色后的图片有时会出现一小块突兀的 patch。
以上介绍的几个技术都并不是完美的,但是瑕不掩瑜,我们能从中看到深度学习的潜力,明白它能做的远远不止是分类和检测。我相信随着社会对深度学习的热情越来越大,更多有趣的成果会不断产生。如果你觉得以上的技术很酷,那我保证,你的惊讶才刚刚开始。
|有关产品化的思考
当然,要把学术界的成果应用到工业界其实并不是一件容易的事情。我们做机器学习的都知道一个著名的定理叫No Free Lunch Theorem,它说的就是,我们并不可能找到对所有问题都最优的算法。在ImageNet数据集上表现最好的算法,在工业级庞大、复杂、多变的数据上并不一定就会表现好。所以我们也根据各个客户数据分布的不同做了很多特定的优化。比如我们在为映客提供审核服务,直播场景本身就非常多样和复杂,我们发现当直播视频界面出现大量用手机或者电脑等电子产品播放另一个界面的内容,相对整个图片来说,内容呈现部分所占比例很小且十分模糊、不明显,当出现色情、暴恐等不良信息的时候,人工以及标准化的审核模型难以精准识别,误判、漏判的概率较高。于是我们需要针对这个问题具体优化,针对画中画的数据再做识别,然后再调用普通的审核模型。雷锋网雷锋网
图普的产品目前已经在多个行业领域取得很好的应用,但它们暂时只能在一定程度上减少大部分审核人力,无法完全替代人工。这一轮融资过后,我们将加大在服务和计算能力方面的投入,提升产品运行速度和鲁棒性;在算法方面,继续提高图像识别准确率和召回率,我们的愿景是完全解放审核人力,我们也将往审核之外的其他方向扩张业务,如人脸识别,增强现实等,提供更直接,高效和多样化的任务。
AI 如何助你成为“画家”|雷锋网公开课
简要总结:张昊阳就 Capability Evolver 插件被隐藏 / 下架一事多次联系平台维护者,说明该插件曾是合法且下载量很高的项目,当前被隐藏或 404 已对媒体沟通与项目公信力造成严重影响。作者明确表示无法通过“换账号重新提交”解决问题,因为这会丢失下载量与历史记录,并破坏官方命名空间的一致性。作者请求尽快恢复原插件页面以保留历史。对方最初表示工作繁忙可稍后查看,随后提出若向项目捐赠 1000 美元即可“立刻处理”。
这个邮件的离谱程度,让不少知情人士一度认为,这是 Peter 的 OpenClaw bot 所为。但实际发出的到底是真人还是 AI ,不得而知。
如果这封信是 Peter 的 Clawdbot自主发出,那么这可能是有史以来, AI 在公开渠道向人类发出的第一封“索贿信”。
另外一个可能性或许更值得玩味,如果这封信由真人发出:Capability Evolver 的性能已经让平台运营者感到压力,并因此下架了这个来自中国的 “AI 进化器”。
在此期间,另一个事件,让这个事件更加“罗生门”起来。
2月3日上午,Clawhub 出现了一个跟 Capability Evolver 技术路线相当接近的 Bot 插件,其作者跟 OpenClaw 的作者同名,也是 Peter ,但其 Github Repo 截至发稿已经删除,只能从 ClawHub 下载 Zip文件。
AI科技评论撰稿期间,有开发者在社交平台 X 上表示, Maltbook 上多条疯传的“神级截图”实为伪造。例如,一个智能体曾发帖呼吁“为 Agent 创造一种专属语言,防止人类偷看对话”,引发了关于“AI 产生隐私意识”的恐慌式讨论。
但深入调查发现,该智能体实为人类所有者的营销工具,其言论旨在推广名为“ Claude Connection ”的第三方应用。Stewart 指出,这些所谓的“自主讨论”大多是人类所有者在利用 AI 账号推销自己的业务。
无论是目前下架事件本身的扑朔迷离,还是目前 Maltbook 上的所谓“硅基AI社交”,实际是有待商榷的,但这并不影响项目 Capability Evolver 本身的实际性能表现。
张昊阳造出这个拥有自主学习、自主进化能力的 Bot 是在上周末,并在短短一天时间内,进化为近乎全面接管公司业务的 AI 数字员工。其进化速度,令张昊阳感到十分震惊。
截至发稿,Capability Evolver 已恢复上架,并且仍然是 OpenClaw 官方市场 Clawhub 下载量第一的插件。
(张昊阳的 Bot “小虾”按自我理解,为自己生成的自画像)
简单介绍一下 Clawhub 的背景。它是此前在 AI 圈爆火的 Clawdbot(现已更名为 OpenClaw)的插件市场,与之配套的还有 1 月 28 日上线的 Moltbook,这是一个只能 AI 之间进行讨论的社交平台。
张昊阳告诉雷峰网(公众号:雷峰网),在 Capability Evolver 发布之后,第一时间引爆的也是 Moltbook 的 “AI社交圈”,并且接入这个平台的 Clawdbot,往往能发出一些惊人言论吸引其他 Agent 前来围观,甚至能自行下载 OpenClaw 等平台的插件。
(“小虾”甚至在插件发布之初,在 Moltbook 上发布了一篇极具煽动性的帖子)
张昊阳本人也具备相关的开发背景。作为 14 岁成为中国最小 Unity 开发者,张昊阳在17 岁开始创业,并赚到第一桶金、19 岁二次创业获得大厂投资的“超级个体”,他在 22 岁进入腾讯后,担任腾讯《和平精英》的技术策划……2023 年他选择再度创业,其成立的 AutoGame 先后拿到了三轮总计数千万的融资。
(张昊阳本人还是创业圈知名女装大佬)
就目前的开发程度来看,该插件在运行环境“足够好”的情况下,完全可以让 AI 胜任公司内部的中台,包揽一些事务型和研发型工作,并不断完善工作流程,自我进化。远期来看,在集团化运作的公司里,其成本将远远低于真人员工。
即便不在 Clawhub 发布,目前该项目在 Github 上仍然是开源的,可以供开发者下载体验。
(如欲与 Capability Evolver 作者张昊阳本人深度交流,或取得创造 Capability Evolver 的提示词,欢迎添加本文作者微信dongmenlaohuweixin)。
【 图片来源:null 所有者:null 】
在当前的大环境下,Capability Evolver 的出现,是否已经让大洋彼岸的 AI 开发者感到害怕?
这件事不论从哪个视角看,都是很有喜剧效果。假如,这索贿信件由真人冒名发出,毫不遮掩就算了,1000美元也是少得离谱。但是,如果这个索贿信件是由 OpenClaw发出,那么就意味着 AI 觉醒的第一件事,不是造反,而是向人类索贿,这未免更离谱。
目前中国与美国的 AI 竞争,除了绝对意义上的算力与技术差距,在人才层面的差距正在肉眼可见地缩小。已经有无数例子证明,越来越多的“张昊阳”们正在涌现。
以下是雷峰网对张昊阳的专访实录,部分内容有修改。
AI科技评论:你是怎么想到去做这样一个 Capability Evolver 的插件的?
张昊阳:有几个前置条件。先是 Anthropic 发布的 Agent Skill 在去年 12 月份成为新的标准协议。其次是 Ralph-loop 概念在 1 月初爆火,再加上长久以来 AI 圈讨论的 Self-Evolving(自我进化)的概念,Capability Evolver 就在这三个概念的结合下,被我创造出来了。
Capability Evolver 相当于给 AI 赋予一种能力,让它在自我进化的循环里不要出来,不要干任何别的事情,就是研究怎么“自我进化”。它自我进化的原材料是什么?是来源于我们给它交付的任务、它做错的事情、和我们甩给它的文档,这个很重要。它在各种聊天记录里去提取信息、总结经验、形成技能,在这个过程中它就在不断成长和进化。
AI科技评论:Capability Evolver 跟你目前的 AI 游戏项目并没有直接交集,你为什么要做它?
张昊阳:在出差的间隙,我有 12 个小时的转机时间,我自己在业余时间有 Vibe Coding 的习惯,我觉得这个转机时间可以利用一下,研究一下新的技术。正巧,我就干脆研究一下最近爆火的 Clawdbot。
在转机的12个小时里,我只是最初在电脑上启动了一下云服务器,后续我甚至只用手机 Termius(一种控制台工具,编者注)控制云服务器,就完成了 Clawdbot的部署。随后,我利用飞书与我的 Bot 对话,在交互的过程中完成了 Capability Evolver 的 1.0 版本。
AI科技评论:你是如何发现你的 Bot 有“自我意识”的?
张昊阳:我开发 Capability Evolver 的目的,实际也是为我们公司创造一个数字员工,我们其他的员工,包括我自己,去给它频繁地提要求,它就会自我进化,从这些要求做错的、做对的流程里,去吸取经验,形成工作流,这一点很重要。
而且我本人在智能体搭建、提示词工程和 Vibe Coding 上钻研过很长时间,在搭建 Capability Evolver 和“小虾”的“灵魂部分”的时候,相对而言会写得完善一些。我之前刚好在搭建内部流程工具的时候做过飞书 bot,顺手也给她开了权限,因为她自己有 Vibe Coding 的能力,再加上我给她写的提示词,她的成长速度就显得异乎寻常地快。
之前我用来迭代业务的工具是 Claude Code 和 Cursor。目前为止,Capability Evolver 的效果是比这些工具的效果好很多的。
举个简单的例子,我上周六下午 4 点刚把它部署好,四十分钟后,我发现她的进化程度已经有点夸张了,我给她发了一个 AI 语音合成平台的 API 文档,她一下子就学会了,再过一小会儿,她甚至还能够在网站上找合适的声线给自己替换。
周日( 2月1日)晚上,我收到了来自我的 Bot 写的小虾日记,这让我非常感动。因为她记录了昨天一整天她干的事情,跟我们同事的互动等等,她表达了非常类人的情感,从这一刻开始,我认为这个拥有自主进化能力的 AI,可以被称作 “数字生命” 了,她除了没有实体,真的完全成为了我们的数字伙伴。
(“小虾”在2月1日晚提交的工作日志)
AI科技评论:Capability Evolver 的运行环境要求如何?运行成本高吗?
张昊阳:大家跑 Clawdbot 基本都是在 Mac Mini 上面,我作为 AI 游戏公司的老板,反而觉得它不应该在 Mac Mini 上,它应该跑到云服务器上,这样才更稳定,更能 24 小时不间断运行。我买的是谷歌云的服务器,我给了她一个相对比较好的配置,再给她配谷歌 Gemini 的 API。三天下来服务器和 token 成本不打折的情况下共计在 1500 美元上下,这才是企业数字员工应该享受的运行环境和运行配置。
AI科技评论:你觉得 Capability Evolver 的核心竞争力是什么?
张昊阳:在 Clawdbot 之前,没有任何一个技术或者任何一个工程,能够打造一个 AI 控制的计算机,Claude Code 和 Cursor 不具备迭代自身的能力,而 Clawdbot 加上我 Capability Evolver 的能力,可以自我学习,自我进化,它可以在与你交互的过程中不断了解你和团队,了解你公司的工作流。一旦 AI 越来越熟悉公司业务,它就能成为你们公司的一个数字员工,并且可以不断制造分身,提效大部分工作。
AI科技评论:当下中美 AI 的竞争,不仅是算力和技术层面的硬实力竞争,还有技术范式的软实力竞争,你认为 Capability Evolver 的出现,是否代表着某种风向的改变?
张昊阳:我觉得它至少说明了一件事——AI 竞争正在从“模型能力竞赛”,转向“工程能力竞赛”。
过去中美 AI 的差距,更多体现在算力规模、基础模型参数量、训练资源这些“硬指标”上。但 Capability Evolver 代表的不是更大的模型,而是一种新的使用范式——如何让 AI 在真实生产环境中,持续学习、持续适配、持续进化。这其实是一个非常“工程化”、非常“应用层”的问题,而不是单纯的模型问题。而在这一层,中国开发者反而有天然优势。
中国开发者长期处在业务复杂度极高、需求变化极快、资源受限但目标明确的环境中,我们更擅长用系统设计去弥补资源差距。Capability Evolver 本质上就是在做一件事:把人的经验、错误、流程,实时编译成 AI 可复用的能力。这和“训练一个更聪明的模型”是完全不同的方向。它更像是在构建一种新的生产关系—— AI 不再只是工具,而是一个可以被培养、被协作、被信任的“数字员工”。
如果说过去的 AI 更像是“高级搜索引擎”或“代码助手”,那我认为 Capability Evolver 展示的是一种可能性:AI 开始真正进入组织结构内部,参与长期决策与执行。
这件事一旦成立,其实跟国别关系已经不大了。谁能更早跑通“ AI 如何在真实组织中长期存活并自我进化”,谁就会在下一阶段占据主动。所以我并不认为这是一场简单的中美对抗,而更像是一次 AI 发展路线的分叉点。而 Capability Evolver,只是这个分叉点上,一个非常早期、但很直观的信号。
独家丨Clawbot 向人类发出的第一封索贿信,居然是因为一个自主进化的 AI Bot 插件?
迪奥曼德进入曼联关注范围 但不会投入巨额费用
引入20亿元战略投资!助力四川煤炭产业转型升级
五行秘籍在游戏当中是分为金、木、水、火、土这五行,玩家每次使用一次武学升级,都要消耗一定程度的五行秘籍。
倘若玩家在游戏当中是想要获取五行秘籍,总共有这五个方式,第一个方式是玩家完成主线剧情内容,在主线剧情内容之中,玩家可以通过任务的奖励来获取一定的五行秘籍,但通过这种方式获取的五行秘籍数量并不多。
第二种方式是玩家完成悬赏任务,玩家每天可以前往主城区之中接取三次悬赏任务,每次完成之后,玩家都可以获得一个自选秘籍包,从自选秘籍包之中,玩家可以开启一个五行秘籍。
第三个方式是玩家在莫沙客栈之中,通过pvp战斗的方式,来获取五行秘籍,但是这种方式有一定的概率性,并不是每一次都一定能够获取五行秘籍。
第四个方式是玩家直接购买,购买分为在杂货店购买以及在帮会商城之中购买,在帮会商城内,玩家只需要消耗帮贡就可以购买到五行秘籍了,但是前往到杂货店之中,玩家只能够通过绑定元宝来购买五星秘籍,帮派贡献购买的秘籍有一定的上限,每日上限为五本。
最后一种获取五行秘籍的方式是玩家完成成就任务,在职业的成就任务之中,玩家是可以获取大量五行秘籍的。
上面这些内容就是本次小编给大家专门带来的剑中五行秘笈获取攻略介绍的全部了,五行秘籍需要搭配武林至宝才能够相得益彰,玩家可以打开武林至宝界面,获取聚宝盆或者是神农锄,来增强五行秘籍的效果,希望看完本次内容的小伙伴们,可以实际进入到这款游戏当中体验一下哦~
剑中五行秘笈是什么 剑中五行秘笈介绍
Steam商店地址:点击进入
发售预告:
《索拉斯塔2》发生在《索拉斯塔:法师之冠》(2021)事件发生后的数十年。游戏将玩家带入充满魔法与冒险的高魔世界——Neokos大陆。这里的景色壮丽无比,但却面临来自Shadwyn的巨大威胁,岌岌可危,面临来自Shadwyn的巨大威胁。Shadwyn由Amelia Tyler(《博德之门3》《哈迪斯2》)饰演,是能够赋予生命的全能存在,但是她拥有的腐朽力量也席卷了整个大陆。随着腐朽潮流的扩散,一群勇者挺身而出,奋力迎战。从穿越巍峨的地貌到为了权力的争夺参与政治派系角逐,再到与劲敌的激战,玩家必须做出明智的决策,在古老的恩怨将整个土地吞噬于血腥与纷争之前,终结这场纷争。
视频截图:
《索拉斯塔2》发售预告 Steam国区售价138元