LangChain学习笔记;给老师的ChatGPT使用指南;中国大模型顶级闭门会交流笔记;飞桨开源任务挑战大赛 | ShowMeAI日报

news/2024/6/29 10:51:58 标签: langchain, AIGC, chatgpt, paddlepaddle, LLM, 大语言模型, 飞桨

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 飞桨PaddlePaddle开源任务挑战大赛,首届「开放原子开源大赛」等你参与

官网:https://competition.atomgit.com/competitionInfo?id=85216ad0ef0811ed99d49fc42bfa011c

百度飞桨参与首届「开放原子开源大赛」,结合当前热门的AIGC先进技术、AI for Science等课题设置了6道赛题。飞桨赛道提供了50万元的总奖金额,每道赛题6万-20万奖金不等。

赛题均基于飞桨开源框架,要求参赛选手提供完整的解决方案与代码,并贡献至指定代码仓库。初赛作品的提交截止日期是9月22日,感兴趣的小伙伴们注意赛题选择和 DDL 哦~

  • 赛题一:使用AIGC进行数据扩充,提升模型在ImageNet上的精度

  • 赛题二:使用AIGC进行数据扩充,提升模型在COCO上的精度

  • 赛题三:SSLD蒸馏Teacher离线化

  • 赛题四:复现人脸控制论文DiffusionRig

  • 赛题五:复现图像编辑论文Null-text Inversion

  • 赛题六:基于PINN的CFD离散网格优化 ⋙ 了解更多

🤖 Perplexity.ai的Chrome插件,可以一键「Summarize」提炼文章要点

Perplexity.ai 是一个人工智能驱动的搜索引擎和聊天机器人,可以通过网络实时搜索为用户查询提供准确、全面的答案

最近 Perplexity.ai 的升级动作很多,ShowMeAI日报也一直有跟踪和同步。在整理资料的时候发现 Perplexity.ai 推出了 Chrome 插件「Perplexity - AI Companion」,可以在浏览网页时提供智能问答和智能摘要功能。

试了一下插件「Summarize」按键,不需要登录直接使用,默认使用英文进行总结,而且对英文内容的总结效果更好。英文浏览环境下一键总结要点还是挺方便的!! ⋙ Perplexity 浏览器插件 - AI Companio

🤖 华为阿里网易等62家企业,通过第二批境内深度合成服务算法备案清单

9月1日,国家互联网信息办公室公开发布了第二批境内深度合成服务算法备案信息的公告。附件显示,第二批有清单中,阿里达摩院、华为、360奇虎、网易等共62家企业、110个算法通过备案。

公告提示,《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续 ⋙ 官方公告

🤖 中国宋庆龄基金会与腾讯推出「AI编程第一课」,教育部等四部门联合推荐

微信搜索「腾讯AI编程第一课」,即可通过官方小程序免费体验

9月1日,中国宋庆龄基金会与腾讯共同发布「AI编程第一课」公益项目,为全国零基础青少年提供AI和编程启蒙平台。

该项目由北京师范大学任学术指导单位,首批上线内容结合国家重大科技议题,通过剧本式的方式,让青少年在1小时的学习实践中认识AI和编程。

项目获教育部校外教育培训监管司、共青团中央宣传部、全国妇联家庭和儿童工作部、中国科协中国科学技术馆四部门联合推荐 ⋙ 了解更多

🤖 一份知识点笔记,分享从 LangChain 中学到了什么

这是一篇 LangChain 的学习笔记,文笔非常轻盈活泼,记录了作者学习过程中的思考、困惑和心得。

以下是这份笔记的「要点笔记」,推荐看看原文,在作者记录的宏观理解和细节思考中,感受那种会心一笑的感觉😁

  1. Memory 模块提供了几种方法来控制上下文传递给LLM的长度,以解决长度限制问题
  • ConversationBufferWindowMemory:回传最后N轮对话

  • ConversationTokenBufferMemory:自动截断对话到最大 token 数

  • ConversationSummaryBufferMemory:总结对话到最大 token 数

  1. Chain 模块实现了串联链、串并联链和路由链等链接调用方式,以灵活处理用户输入

  2. Agent 模块实现了 ReAct 论文中的思想,让 LLM 自己选择下一步行动;但目前需要限制LLM的思考次数,避免循环造成费用问题

  3. 作者认为 LangChain 设计过于复杂,使用成本高,测试用例不足,可维护性差;但它确实提供了一些有价值的模块和接口

  4. 作者建议深入研究ReAct 论文、Prompt 设计、Memory 与 Chain 模块的运用、优化 Agent 与 COT 的输出

  5. LangChain 还需要更多实践探索,与其他方法如强化学习结合,可能能发挥 LLM 更大的潜力 ⋙ 笔记

🤖 OpenAI官网博文,分享教育工作者的 ChatGPT 使用指南

OpenAI 在官网分享了一篇名为「Teaching with AI」的博文,通过案例来展示 ChatGPT 如何为教育工作者提供教学辅助,包括各种使用场景、高频 Prompt 和注意事项。

教师如何使用ChatGPT

  1. 角色扮演具有挑战性的对话:教师让学生与ChatGPT进行角色扮演对话,从不同视角理解学习内容

  2. 生成测验、测试和教案:教师利用ChatGPT根据教学大纲生成测验、测试和教案

  3. 减少非英语母语者的语言障碍:教师让不以英语为母语的学生使用ChatGPT提高英语水平

  4. 教导学生批判性思维:教师引导学生批判性思考ChatGPT提供的信息

同时给出了几个入门的提示词模板

  1. 生成课堂教案:让ChatGPT根据教师提供的信息生成自定义的教案

  2. 创建有效的解释、例子和类比:让ChatGPT用简单明了的方式为教师生成有效的解释、类比和例子

  3. 通过教学帮助学生学习:让ChatGPT以学生身份教授一个话题,然后教师评价其教学效果

  4. 创建一个AI助教:让ChatGPT模拟助教,根据学生需要解释概念、提问以帮助其理解

注意事项

  1. 模型可能并不总是产生正确的信息:它们只是一个起点;你是专家并且负责材料

  2. 它们可能并不适合所有教室:你最了解你的班级,可以在查看模型的输出后做出决定 ⋙ OpenAI Blog (英文) | 中文翻译版

🤖 Gartner 发布2023年版本的技术成熟度曲线,盘点近5年的起起落落

  • 技术成熟度曲线 (Hype Cycle) 通过图形来呈现前沿技术发展阶段,由全球著名咨询机构 Gartner 每年一次发布一次

  • 曲线由五个部分组成,分别对应了新技术发展的五个阶段:技术刚刚流行的启动期 (Innovation Trigger)、随着关注度提升的热门关注期 (Peak of Inflated Expectations)、热度下降的低谷期 (Trough of Disillusionment)、爬升期 (Slope of Enlightenment)、高原期 (Plateau of Productivity)

Gartner 近期连续发布了「Hype Cycle for Artificial Intelligence, 2023 (2023 年AI技术成熟度曲线)」「Hype Cycle for Emerging Technologies, 2023 (2023 年新兴技术成熟度曲线)」两份报告,对相关技术进行了系统的分析及发展预测。

整理了近5年的 Gartner 曲线,一起从动态的视角来观察:哪些赛道正当红?哪些是潜力股?哪些已经被Gartner 抛弃?

通过2019年以来的「Hype Cycle for Emerging Technologies」图可以看到,Gartner 这些年在预测方面愈发保守,基本上预测只截止到 Peak of Inflated Expectations,好处是可以大幅提升预测正确率,问题是回避了重要且艰难的判断——也就是处于低谷期但真正有价值的技术。

  1. Generative AI / GAN:当红炸子鸡,2019年开始上线,2023年跑到了Hype的顶峰,这应该算是Gartner的得意之作

  2. Blockchain / NFT / Web3 / Decentralized Identity / Decentralized Finance:2018年Blockchain最后一次出现并滑向低谷,2021/2022年NFT、Web3、Decentralized Identity曾经出现在曲线的Hype附近,今年不再有任何痕迹

  3. AR / MR:2018年的时候最后一次出现在谷底,之后从曲线上彻底消失

  4. Metaverse / Digital Twin / Digital Humans / AI simulation:严格来说这几个技术并不相同但殊途同归,本质上都是在对现实世界做数字化,断断续续一直到今年都还在线上,只不过进展相对缓慢

Gartner在AI赛道的预测更完整,可以看着很多AI技术走完全程。具体来说,AI技术可以分成以下这几个组:

  1. 毕业组:Speech Recognition 和 GPU Accelerator 已经毕业,Computer Vision、Data Labelling and Annotation即将毕业,能够看到它们完整的晋级路线

  2. 爬坡组:Autonomous Vehicles (自动驾驶) 在2020年跌到谷底之后开始缓慢爬升,到2023年终于变成了「还需要5-10年」;其余在爬坡的技术还包括AI Maker and Teaching Kits、Cloud AI Services、Intelligent Applications等

  3. 已卒组:NLP在停滞几年之后终于在2023年里消失,类似被新瓶装的旧酒还包括 Machine Learning 和 Deep Learning,Knowledge Graphs不知道还能撑多久

  4. 当红组:Generative AI、Foundation Models、Prompt Engineering 在曲线上中都被分到了「2-5年」这个组里

  5. 潜力组:Smart Robots (机器人)、Synthetic Data (数据合成)、Neuromorphic Computing (类脑计算)、Responsible AI (可信AI)等等,AGI (通用人工智能) 在曲线上的位置也大大前进了一步

  6. 新上榜组:Multiagent Systems 和 Automatic Systems 2023年首次出现在曲线上,证明Gartner还是挺敏感的;希望在未来几年能够看到Agent和具身智能在曲线上快速爬升 ⋙ Gartner 官网 | 完整版 ⇢ 即刻@Diiiii

🤖 顶流群聊笔记,中国大模型「半壁江山」闭门交流里聊了什么

8 月 23 号,西溪论道参会者合影,图片来自极客公园

经过前半年的极度兴奋和「过度想象」,一个可能长达 10 年的技术革命,现在才真正开启「万里长征」,进入真正的艰难拓荒期

这是阿里云与中国大模型领域优秀创业者进行的一次长时间闭门交流,作者作为参与者,整理了会议中讨论的当前大模型技术发展状况、商业化路径和未来发展方向。以下是文章的核心观点的整理:

  1. 关注大模型,更需要关注infra:在大模型领域 GPU 等算力资源是最核心和稀缺的,所以企业更应关注如何提升基础设施团队的能力,通过优化计算模式来提高有限GPU资源的利用效率

  2. ChatGPT点燃热情,Llama2让人脚踏实地:ChatGPT点燃了创业者对大模型的热情,而Meta开源的Llama2模型让大家认识到现实的困难,需要脚踏实地基于开源模型不断迭代产品

  3. 大模型ToB现状和实践:现阶段客户对大模型的需求有差异,大模型需要与具体场景对接,SaaS 公司将大模型引入也取得了客户认可

  4. AGI值得献身,但也不要玩命:大模型带来 AGI 曙光值得追求,但当前阶段也需要理性认识技术边界,稳扎稳打地推进

  5. 如何通向AI native:完全依赖大模型是AI native应用的特征,社交+Agent可能成为早期案例,但需要多模态能力的进一步发展

  6. 大模型时代,服务大B还是小B:服务长尾的小微企业也能成就巨头,这些客户更看重增长并愿为此进行支付

  7. 大模型对云意味着什么:大模型带来新的算力需求,云计算平台需要作为产品来满足需求,并构建生态而不是闭环自研;大模型也可能催生新一代中国 SaaS


文中多位大佬的发言也非常精彩,很少能看到这么高密度的观点交锋。选择了文中提到的几位,推荐去看原文哦!

  1. 李开复 (创新工场董事长、零一万物创始人):提出要重视Infra结构,因为算力是大模型的稀缺资源;要组建更强大的Infra团队,提高算力利用效率;大模型才刚刚起步,像GPT-4这样的模型才是下一个高度

  2. 王小川 (百川智能创始人&CEO):分享百川智能的高效率落地法则,即利用搜索技术团队的优势,通过搜索增强、强化学习等方式提升模型效果;表示理解技术内在逻辑很重要

  3. 李志飞 (出门问问创始人&CEO):认为开源模型可以有效降低门槛,后续仍需要投入进行迭代;表示垂直领域大模型同样重要;并举例成功案例

  4. 周明 (澜舟科技 CEO):表示开源模型是基础,需要在行业数据上继续训练,以建立壁垒;大模型价值80%来自非中心化场景应用

  5. 彭健 (华深智药创始人&CEO):认为大模型的「幻象」在某些领域如药物设计是有益的

  6. 张阔 (智谱 AI CSO):也认为大模型价值80%来自非中心化应用

  7. 李开复:认为Copilot等不算真正的AI原生应用,需要抛弃兼容性;只依赖大模型的应用才是原生的

  8. 张勇 (阿里云董事长):提出服务小微企业也是一个巨大蓝海,这些小B其实相当于C端用户;建议明确自己要服务的客户群

  9. 张勇:表示云计算平台需要作为大模型的生态伙伴,共同创造价值;中国有望出现新一代SaaS或智能服务 ⋙ 推荐阅读原文

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!


http://www.niftyadmin.cn/n/4994757.html

相关文章

2023年淘宝商家成长层级与利好规则

淘宝店铺成长层级越高,对店铺的经营会越好,但有些小伙伴对成长层级和商家利好规则内容的更新变化不太清楚,下面我们就来一起了解一下吧。 一、店铺成长层级 1、入口:店铺层级与权益 2、晋升路径 V1-V2:基础运营&#…

NestJs 中使用 cookie

HTTP cookie 是用户浏览器存储的一小段数据。Cookie 旨在成为网站记住状态信息的可靠机制。当用户再次访问该网站时,cookie 会自动随请求一起发送。 安装插件 首先安装所需的包(以及 TypeScript 用户的类型): $ npm i cookie-p…

C语言枚举类型enum详解、枚举变量。枚举函数

文章目录 枚举定义枚举应用枚举函数枚举函数2 枚举定义 关键字:enum 用途:定义一个取值受限制的整型变量,用于限制变量取值范围;宏定义的集合 定义枚举变量: enum{FALSE 0, TRUE 1} EnumName; 因为枚举变量类型较长…

系列五、Java操作RocketMQ简单消息之同步消息

一、概述 同步消息的特征是消息发出后会有一个返回值,即RocketMQ服务器收到消息后的一个确认,这种方式非常安全,但是性能上却没有那么高,而且在集群模式下,也是要等到所有的从机都复制了消息以后才会返回,适…

【Java 基础篇】Java 数组使用详解:从零基础到数组专家

如果你正在学习编程,那么数组是一个不可或缺的重要概念。数组是一种数据结构,用于存储一组相同类型的数据。在 Java 编程中,数组扮演着非常重要的角色,可以帮助你组织、访问和操作数据。在本篇博客中,我们将从零基础开…

在数字时代中,该怎么保留温暖的传统

在我们现代快节奏的数字时代,许多人会不禁思考,传统的壁炉是否还有存在的必要。毕竟,现代家庭通常配备了先进的暖气系统和电子设备,能够在寒冷的日子里提供温暖。然而,尽管科技的进步使得家庭取暖变得更加便捷&#xf…

算法竞赛入门经典习题2-6 排列(permutation)

排列&#xff08;permutation&#xff09;——算法竞赛入门经典_还记得樱花正开~的博客-CSDN博客 上面的代码很厉害&#xff0c;学习...我的代码水平就比较差了... #include <cstdio> #include <set>int main(){for(int i 123; i < 329; i){std::set<int&…

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等(更新中)

文章目录 一、Base modelchatglm2模型Vicuna模型LLaMA2模型1. 训练细节2. Evaluation Results3. 更多参考 alpaca模型其他大模型和peft高效参数微调二、垂直领域大模型MedicalGPT&#xff1a;医疗大模型TransGPT&#xff1a;交通大模型​EcomGPT&#xff1a;电商领域大模型1. s…