大模型研讨课 / 2024

课程简介

大模型正在重塑计算机科学的研究范式。2024年度诺贝尔物理学奖和化学奖均授予了大模型相关方向的人工智能科学家。本课程邀请活跃在一线的优秀青年科研人员,从系统的角度,介绍大模型的结构、预训练、后训练、微调、推理、系统软件等基础知识,以及前沿进展。

  • 课程时间:2024年10月31日-2025年01月02日,每周四晚19:00-21:00
  • 课程地点:计算所中关村园区四层报告厅

参加课程

扫码预约登记,免费参加

扫描二维码,观看直播,腾讯会议号:674-9681-9671


主讲人介绍

陈云霁
处理器芯片全国重点实验室 主任

他带领团队研制了国际上首个深度学习处理器芯片“寒武纪1号”,相关成果两获计算机体系结构顶级国际会议最佳论文奖,并已应用在上亿台智能手机和服务器中。他的学术论文受五大洲、三十个国家、数百个知名机构广泛跟踪引用。因此,他被Science杂志刊文评价为深度学习处理器的“先驱”和“引领者”,并获我国处理器芯片领域历史上唯一的国家自然科学二等奖(第一完成人)。他还曾获国家杰出青年科学基金、全国五一劳动奖章、中国青年五四奖章、全国创新争先奖、何梁何利科技创新奖、教育部“青年长江学者”,并被MIT技术评论评为全球35位杰出青年创新者(2015年度)。

张蕊
中国科学院计算技术研究所 副研究员

研究方向为深度学习和处理器设计智能化,长期从事人工智能算法和软硬件协同相关的研究工作。先后在人工智能相关领域的国际顶级期刊和会议上发表高水平论文40余篇:多次荣获中科院计算所优秀科研人员称号。

赵永威
中国科学院计算技术研究所 副研究员

研究方向为智能处理器体系结构。他在ISCA、MICRO、Proc.IEEE等会议和期刊上发表学术论文15篇。曾获得中国计算机学会优秀博士学位论文奖、MICRO 2022最佳论文Runner-up奖。

文渊博
中国科学院计算技术研究所 副研究员

研究方向为智能处理器体系结构和系统软件。深度参与多款深度学习处理器的系统软件研发工作,在ASPLOS、MICRO、ICML,NeurIPS等顶级会议和期刊上发表论文10余篇。

黄迪
中国科学院计算技术研究所 特别研究助理

主要研究方向为人工智能与代码生成,在包括NeurIPS、ICLR、AAAI等在内的会议上发表多篇论文。

郭家明
中国科学院计算技术研究所 特别研究助理

主要研究方向包括网络结构搜索算法、边缘端加速、强化学习、元强化学习、大语言模型等,曾在ICML、NeurIPS、ACL、IJCAI、AAAI等会议发表多篇论文。

彭少辉
中国科学院软件研究所 特别研究助理

主要方向为大模型智能体和具身智能,以及大模型在高性能代码生成领域的应用,在NeurIPS、AAAI、ICML等会议上发表多篇论文。

严彦阳
中国科学院计算技术研究所 特别研究助理

研究方向为计算机视觉与媒体内容安全。发表多篇计算机视觉会议及期刊(CVPR、ICCV、TIP、TIFS)论文并多次担任相关审稿人。

张子豪
中国科学院计算技术研究所 特别研究助理

主要的研究方向是具身智能中的导航与操作,他是AnySyn3D社区的组织者之一,他的个人主页是www.zihaozhang.tech

高云凯
中国科学技术大学 博士生

主要研究方向包括强化学习、元强化学习、离线强化学习、大语言模型等,曾在NeurIPS、ICML、 AAAI等会议发表多篇论文。

蓝思明
中国科学技术大学 博士生

主要研究方向包括强化学习、多任务强化学习、元强化学习、大语言模型等,曾在NeurlPS、ICML、AAAI等会议发表多篇论文。