?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦!
? 会玩儿!承包地铁专列,真人移动广告 | 百度世界大会预热
百度也是会玩儿!承包了北京地铁一号线的「大模型专列」,贴满了大语言模型和生成式AI相关主题的内饰,还有真 (shuai) 人 (ge) 版移动广告!广告板上密密集集全是梗,精准戳中我的笑点啊~ 知道了知道了,百度要开大会了?
https://baiduworld.baidu.com/m/world/2023
10月17日, 以「生成未来 (PROMPT THE WORLD)」为主题的Baidu World 2023将在北京首钢园举办。作为百度年度最重要的战略、技术、产品发布会,大会自2006年以来已连续举办17年,这也是近四年来首次恢复线下举办。届时,百度将发布多款AI原生应用介绍大模型最新进展,还将举行面向企业、开发者、合作伙伴、投资人等分论坛,设置前沿A互动体验区,全面展现百度最新成果。
? 24家国内大模型公司面经,分享最新鲜的感受与经验
这篇文章的作者是个猛人,在半年时间里陆续面了国内24家大模型公司,拿到了9个Offer。作者这篇面经整理了24家公司的面试经历 (被拒的也介绍了原因),而且分享了经验判断和面试中的高频问题,非常值得阅读和收藏~
以下是作者整理的面试高频问题,果断收藏起来~
多头注意力:时间/空间复杂度,优化 (kv-cache、MQA、GQA),手写多头代码
框架相关内容:各种并行方式与优缺点,DeepSpeed、Megatron可以看看源代码,Flash-Attention等内容
BERT / GPT等主流大模型的细节:比如位置编码,训练loss,激活,架构些许不同等
大模型训练:确认实际的相关工作经验和技巧,比如训练loss炸掉了如何解决等
数据预处理:BPE,tokenization,mask相关概念和对模型/训练影响,数据配比 (有paper)
evaluation:如何评估大模型,安全性,有效性,公开数据,个别考过手写eval框架 (多选,生成)
多模态和RLHF:根绝所投岗位适当看看,看paper很重要,也大多是研究岗位 ⋙ 阅读原文
? 为期一个月的「AI+游戏开发季」,探索Al创作的边界
https://www.gmhub.com/jams/aijam2023
这场「GENE|AI主题Game Jam游戏极限开发挑战」很特别呀!不仅时长拉到了一个月,还筹备了4个Part,来共同探索究竟什么是AI原生游戏、AI创作能力的优势和边界。
以下是各part主要内容,看介绍页面觉得专业又有趣,值得了解一下!
5场AI×游戏跨界直播:邀请了来自海内外游戏公司、生成式AI公司等19位一线从业者跨界连麦,共同探讨生成式AI在原画概念、动画视频、3D资产、原生玩法和游戏音乐五个主题的探索和应用
48小时GameJam极限开发挑战:集合了多家国内活跃的生成式AI合作伙伴,围绕着探索AI能否带来新玩法、新体验,来进行一场特别的 Game Jam 游戏开发活动
WePlay游戏展AI游戏展区:欢迎玩家和从业者来体验试玩AI主题Game Jam及优秀AI作品,还特别邀请到专注于AI+游戏的开发者社区LitGate、国内领先的在线AI绘画平台Tiamat、国内知名的3D超写实形象生成交互平台影眸科技,他们将展示其与游戏的碰撞
AI游戏开发的闭门讨论会:围绕AI游戏开发主题,邀请来自国内知名大厂、初创团队的AI游戏探索者分享其项目经验 ⋙ 了解更多
? 大语言模型的法律应用的原理和实践:律师 & 生成式AI
这是一个「AI+法律」的系列内容,作者结合法律实务和大模型的能力,将「大语言模型的法律应用」分成了6个板块,并逐个进行解释和场景实践展示。
R技能:检索 (找到需要的信息) | 不仅仅是基于关键词的搜索,更是通过理解上下文和语义来找到最相关的信息;在法律领域,这意味着可以快速找到相关的法律条文、案例或其他参考资料
G技能:生成(根据需求生成内容) | 根据给定的输入或需求生成新内容的能力;在法律工作当中,需要起草大量的文章,字斟句酌的过程往往需要耗费大量的时间,而现在有办法解决这一难题了
S技能:总结 (从文本中提取信息) | 法律工作除了写作,还需要阅读大量的实务文章和裁判文书;大模型可以快速阅读大量的文章,并且提供准确的摘要
T技能:转化 (让A变成A’) | 基于大模型的语义理解能力,它可以充当完美的翻译软件,也能将复杂的法律条款解释得通俗易懂,或者根据特定的需求改写文本的风格和语调
C技能:比较 (对比内容差异) | 不仅仅是表面上的对比,而是深入语义层面的分析;在法律领域,这意味着用户可以比较不同的法律文档、案例或法律观点,从而找出它们之间的相似之处和差异
V技能:验证 | 可以用于比较法律文本是否与相关的法律、法规或判例相符,或者是否存在潜在的矛盾和问题;在法律领域这有助于确保文档的法律准确性和专业性
系列文章目前更新了「R技能」「S技能」两个部分,法律相关从业者或对此感兴趣的伙伴可以 follow 一下:
R技能:检索丨人类第一次使用自然语言从互联网获取信息
场景一:从法律层面解读新闻报道
场景二:理论问题检索
场景三:实务问题检索
场景四:法律条文检索
场景五:类案检索
S技能:总结丨让 OpenAI 创始人爱不释手
场景一:总结法律研究报告 (本地文件)
场景二:总结实务文章 (在线文章)
场景三:总结法学论文
场景四:法律法规梳理
场景五:法律事实梳理 ⋙ R技能:检索 | S技能:总结
? 红杉美国 | 生成式AI进入第二阶段,市场进入到起飞时刻
红杉合伙人 Sonya Huang 和 Pat Grady 再出新文「Generative AI’s Act Two」,回顾了生成式人工智能在过去一年的发展,并提出其已经进入第二阶段,从最初的技术导向转向以客户为导向,从展示冷门技术转向解决真实问题。过往几十年的时间里积累了生成式AI市场起飞所需的条件,而现在时间终于到了!
第一阶段是发现了新的「锤子」(基础模型),现在则是想着第二阶段演进 (端到端的解决问题)
更新了行业地图,并且按照Consumer、Enterprise、Prosumer的框架重新划分 (图1)
增加了LLM开发者生态的行业地图 (图2)
回溯了之前判断中的错误:发展速度比所有人预期的都快、瓶颈不是客户需求而是GPU、应用和底层模型并未分离、竞争的急速加剧、大家伙们并没有落下、壁垒在客户而不是数据
当然也确定了之前一些推论是正确的:生成式AI是一件大事、杀手级应用出现 (ChatGPT、Character AI、Midjourney)、开发者很关键、大模型能力持续进化、版权 / 道德 / 伦理问题
从月留存和用户活跃 (DAU / MAU) 数据对比,现在的AI应用相较于古典 Web2 的那些大家伙们还有比较大的差距,他们需要持续的「证明价值」,以度过「awkward teenage years」 (图3) ⋙ 阅读原文 | 中文翻译版本
? 如何找到你的第一个客户 | 早期创始人必须亲自做销售
初创公司的早期获客问题可谓生死攸关。如果你处在创业早期或者有意创业,可以看看YC 合伙人 Gustaf Alströmer这篇文章。
文章的一个核心观点是,早期的销售工作不仅至关重要,而且创始人必须亲自参与其中。以及,许多看似聪明且可扩展的增长方法并不适用于早期创业公司,反而比较原始野蛮的方式更能快速获得第一批客户。
当然作者分享的一些方法和渠道是基于美国的,照搬至国内是行不通的,理解其核心精神就好~
一、早期创始人要亲自参与销售这个“笨”事情
二、创业者需要的 5 点销售认知
了解你的客户和他要解决的问题
做好销售才能更好把控公司的命运
搭建销售团队之前要自己做销售
学会销售并不难
你要很了解你真正在解决的问题、你的产品和所在的市场
三、5 种方法找到客户
抢占先机,尽早销售
善用电子邮件销售:篇幅简短、语言简明易懂、解决问题、内容用纯文本编写、用具体信息展示自己、插入网站链接、邀请进入下一步沟通
理解销售漏斗:销售漏斗的五个环节、从难度最小的客户开始销售、建立大的销售渠道、借助你的社会关系进行销售、销售给创业公司更容易、广撒网寻找早期使用者
选择合适的收费策略
从目标开始逆向工作:使用 CRM 软件了解客户转化率、对外销售需要广撒网 ⋙ 原文 | 中文翻译版本
?? AI音乐生成,前沿产品和技术原理一览
这篇文章很有意思!是比较难得的「技术+产品」综合视角的文章,介绍了AI音乐生成的最新进展,包括谷歌的MusicLM、Meta的 MusicGen、Stability AI的StableAudio。文章介绍了这些音乐生成模型的技术原理,以及它们取得的突破与面临的挑战。
第一部分:简介。介绍了最近音乐生成领域的进展 (包括MusicLM、MusicGen、StableAudio等新平台),指出这些新模型展示了与图像和文本生成相媲美的质量飞跃
第二部分:文本条件化。解释了如何通过学习文本和音乐的联合嵌入来实现基于文本的音乐生成,介绍了MuLan和CLAP两种文本音乐联合表示学习方法
第三部分:MusicLM。详细介绍 MusicLM 的技术原理,包括3种token表示音乐的不同方面,以及如何使用旋律条件控制音乐轮廓
第四部分:音乐表示。解释了残差向量量化(RVQ)如何将音频压缩为离散的token序列,以及不同的token交织模式
第五部分:时长控制。介绍StableAudio如何通过时长条件,控制生成音频的长度,克服固定时长的限制
第六部分:结束语。总结了当前音乐生成模型在产生连贯音乐和准确控制音质方面仍面临挑战;但明确表示行业正在向这些系统的商业部署发展,未来可能还会有激动人心的新进展 ⋙ 阅读原文
? 基于生成式AI的教育产品图谱,50+产品构建的工作流
这篇笔记以一个线性逻辑,按照「教-学-练-评-教师发展」对教育应用进行了分析,并对各种细分场景下的应用进行了详细介绍和评级。顺着这篇文章操作下来,就可以体验非常完整的「AI教育工作流」。
教:帮助老师做课前准备,课中可以使用的教学活动,和课后练习的教育应用
学:学生可以自学,也可以是一个虚拟老师教学生或给学生答疑
练:既可以是以闪卡形式进行练习,也可能是对某个特定科目,如语言、数学等进行练习和复习
评价与反馈:最常见的写作和数学题目的批改
教师发展:如帮助老师做教学评估、教学研究、知识拓展等或工具包等 ⋙ 阅读原文
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 ?日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!文章来源:https://uudwc.com/A/woq6Z
◉ 点击 ?生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!文章来源地址https://uudwc.com/A/woq6Z