怎么做带网站连接的表格,怎么引流推广,忻州专业网站建设,六安网本期为TechBeat人工智能社区第603期线上Talk。 北京时间6月26日(周三)20:00#xff0c;北京大学PKU-DAIR实习生—余昭辰的Talk已经准时在TechBeat人工智能社区开播#xff01; 他与大家分享的主题是: “从多模态理解到生成 - 从LLM到Diffusion Model”#xff0c;在本次Talk… 本期为TechBeat人工智能社区第603期线上Talk。 北京时间6月26日(周三)20:00北京大学PKU-DAIR实习生—余昭辰的Talk已经准时在TechBeat人工智能社区开播 他与大家分享的主题是: “从多模态理解到生成 - 从LLM到Diffusion Model”在本次Talk中他向大家介绍了PKU-DAIR课题组在大语言模型和扩散模型两个领域上的最新研究成果并提出将LLM和Diffusion Model进行结合的新思路。 Talk·信息
▼
主题 从多模态理解到生成 - 从LLM到Diffusion Model
嘉宾北京大学PKU-DAIR实习生 余昭辰
时间北京时间 6月26日(周三)20:00
地点TechBeat人工智能社区
点击下方链接即可观看视频
TechBeatTechBeat是荟聚全球华人AI精英的成长社区每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验加速并陪伴其成长。https://www.techbeat.net/talk-info?id882
Talk·介绍
▼
大语言模型Large Language Models, LLMs与扩散模型Diffusion Models都是生成模型可以根据输入条件生成新的数据样本。大语言模型主要生成文本扩散模型生成图像或其他形式的数据。两者都是当前人工智能研究的热点领域LLM/MLLM更侧重于多模态数据的理解与推理而Diffusion Model更侧重于生成多模态数据建模其分布。本次talk将介绍本课题组在两个领域上的最新研究成果并提出将LLM和Diffusion Model进行结合的新思路。 Talk大纲
1. 增强大语言模型推理的思维缓存方法——Buffer of Thought
2. 将扩散模型用于不同数据建模生成
1文生视频——ContextDiff
2文生3D——IPDreamer
33D小分子药物设计——IRDiff
3. 将LLM与Diffusion Model进行结合用于复杂多模态数据生成
1组合式/长文本文生图——RPG
2组合式/复杂文生视频——VideoTetris
3拥有世界知识的图形编辑器——EditWorld Talk·预习资料
▼ 论文链接 https://arxiv.org/abs/2406.04271 项目名称 Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models 项目链接 https://github.com/YangLing0818/buffer-of-thought-llm 论文链接 https://openreview.net/forum?idnFMS6wF2xq 项目名称 Cross-Modal Contextualized Diffusion Models for Text-Guided Visual Generation and Editing - ICLR 2024 项目链接 https://github.com/YangLing0818/ContextDiff 论文链接 https://arxiv.org/2310.05375 项目名称 IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts 项目链接 https://github.com/YangLing0818/IPDreamer 论文链接 https://openreview.net/forum?ideejhD9FCP3 项目名称 Interaction-based Retrieval-augmented Diffusion Models for Protein-specific 3D Molecule Generation (ICML 2024) 项目链接 https://github.com/YangLing0818/IRDiff 论文链接 https://arxiv.org/2401.11708 项目名称 Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs - ICML 2024 项目链接 https://github.com/YangLing0818/RPG-DiffusionMaster 论文链接 https://arxiv.org/2406.04277 项目名称 VideoTetris: Towards Compositional Text-To-Video Generation 项目链接 https://github.com/YangLing0818/VideoTetris 论文链接 https://arxiv.org/2405.14785 项目名称 EditWorld: Simulating World Dynamics for Instruction-Following Image Editing 项目链接 https://github.com/YangLing0818/EditWorld Talk·提问交流
▼
在Talk界面下的【交流区】参与互动留下你的打call和问题和更多小伙伴们共同讨论被讲者直接翻牌解答 你的每一次贡献我们都会给予你相应的i豆积分还会有惊喜奖励哦
Talk·嘉宾介绍
▼ 余昭辰
北京大学PKU-DAIR · 实习生
余昭辰北京大学数据与智能实验室PKU-DAIR本科实习生研究方向为扩散模型与大模型已在ICLR、ICML等顶会上一作发表两篇论文担任NeurIPS等顶会审稿人。 个人主页: https://www.techbeat.net/grzytrkj?id38118 关于TechBeat人工智能社区
▼ TechBeat(www.techbeat.net)隶属于将门创投是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地分享自己最新工作的沃土在AI进阶之路上的升级打怪的根据地 更多详细介绍TechBeat一个荟聚全球华人AI精英的学习成长社区