快捷搜索:  

斯坦福美女博士创业项目爆火,ai视频天生出道即顶流,半年融资5500万美元

"斯坦福美女博士创业项目爆火,ai视频天生出道即顶流,半年融资5500万美元,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 这篇报道的观点独到,让人眼前一亮。 新闻的写作风格流畅,文笔优秀,让人容易理解。 这篇报道的结构严谨,逻辑清晰,让人看了很舒服。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院超人测评36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作斯坦福美女博士创业项目爆火,AI视频生成出道即顶流,半年融资5500万美元量子位·2023-11-30 09:35关注Stability AI创始人点赞

斯坦福华人博士休学搞创业,直接火爆AI圈!

新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。

OpenAI大牛Andrej Karpathy转发,并激情附上长文一段:

每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。

就连Stability AI创始人也来点赞:

这个新产品名为Pika 1.0,背后公司Pika于今年(This Year)4月成立。

要知道,这一行的产品已有不少,如成立5年的Runway等公司。

在AI视频生成“乱花迷人眼”的当下,这个新产品究竟是如何做到迅速破圈,吸引大量关注度的?

从放出的Demo效果来看,Pika 1.0不仅能根据文字图片,流畅地生成一段视频,动静转换就在一瞬间:

而且可编辑性还特别强,指定视频中的任意元素,一句话就能达成快速“换装”:

这样的效果,也使得公司成立仅半年,产品用户已经超过52万人。

更是新斩获5500万美元融资,其中个人投资者不乏各种大牛,如Quara创始人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。

所以,Pika究竟有没有看起来这么好用?我们(We)也立刻上手体验了一番。

01 AI视频新顶流长啥样?

此次火爆出圈的Pika 1.0,是Pika发布的第一个正式版本产品。

经过四个多月Discord社区的测试,Pika认为是时候推出本次重大升级了。

相比之前Pika还只能用文字可能图像生成视频,如今的Pika 1.0,功能要更加丰富——

不仅能根据文字、图片可能视频风格生成视频,还能对视频局部进行(Carry Out)编辑。

可编辑性有多强?

不仅画面大小任意扩展,从5:2、1:1画布,到9:16以及16:9的超大屏,4种选择无缝转换:

像什么3D、动漫、电影(Movie)等各式各样的风格滤镜,那就更不用说了。

最重要的是,1.0正式版推出了用户更友好的网页版,不用在discord中一遍遍艾特机器人,就能直接上手玩。

(不过,现在它还需要排队,需要点耐心。)

当然,也可以移步Discord社区先上手体验一番。

尽管它还未随网页版更新到Pika 1.0,但我们(We)也实测了一下文字、图片生成视频的效果,还不错。

加入社区之后,直奔“Creations”,从下面的10个生成区随便选择一个进入即可开耍。

在输入框中输出“/”,选择最简单的“/create”命令:

在此,我们(We)输入“a robot dancing in the rain, sunset, 4k, -gs 8”提示词交给机器人。

大概也就半分钟的时候,视频就出来了,速度相当快:

‍效果嘛,雨没有表现得很明显,但机器人的肢体动态性真的很强。

我们(We)再来一个稍微长一些的提示词:

a teenager walks through the city streets,takes pictures of places(一个青少年穿过城市的街道,拍摄照片)

仍然超级快,结果(Result)就出来了:

Wow,这次真的有很满意,画面符合脑海中的预测,甚至比我们(We)想象得还要好。

除了纯文字,咱还可以上传一张参考图像进行(Carry Out)创作,使用“/animate”命令。

当当,一张静态表情包就动起来了:

总的来看,Pika给出的视频时长都是3s(所以使用太长的提示词也没用,后面会直接忽略掉),以及它还不能保证每次结果(Result)都很满意,但总体来说多试几次还是有不错的结果(Result)出现的。

在自测之外,我们(We)也来看看网友的作品,其中不乏非常惊艳的效果。

比如有人创作的这只小怪兽,憨态可掬,让人忍不住想摸一把:

还有这段两位小女孩的演奏画面,看完我好像真的听到了优美的嗓音从中传出:

最绝的还是这个白鸽围绕短发美女翻飞的场面:

也太有氛围感了吧~

看罢如上效果,我们(We)也来盘盘这家公司究竟是什么来头。

02 两位斯坦福华人博士创立

Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

据The Information消息,郭文景于今年(This Year)四月创立了Pika,随后Chenlin Meng加入成为联创,两人合作开发了这个文本生成视频模型。

从二人学术经历来看,她们(They)分别专注于NLP和计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。

联合创始人兼CEO郭文景,斯坦福大学(University)AI实验室(NLP 图形学方向)博士。

她在米国出生,杭州长大,初中(Junior High School)就读的是杭州外国语学校,从小就接触编程,夺得过IOI银牌,从本科开始正式留学,被哈佛大学(University)提前录取。

此次创业,她的领英主页显示休学中(On Leave),应该是打算先忙创业的事情。

在斯坦佛大学(University)读博之前,郭文景在哈佛大学(University)取得了计算机硕士和数学本科学位。

在本科期间,她曾经gap过一年,专程在Facebook AI Research全职做了一段时间的研究工程师。

在职期间,她参与了用Transformer分析2.5亿个蛋白质序列的研究,目前(Currently)这篇论文引用已有1200+,其中就包括后来大火的AlphaFold2:

除此之外,她也先后在Epic Games、谷歌和微软等多家公司实习过。

这次创业,郭文景的导师Christopher D Manning也给予了不少支持。

Christopher D Manning以NLP方向的研究闻名,如今在谷歌学术上的引用量已有23w+,而他也将成为Pika的学术顾问之一。

联合创始人兼CTO Chenlin Meng,同样是斯坦福计算机博士。

在此之前,她于2020年在斯坦福大学(University)获得了数学本科学位。

相比郭文景在NLP领域的研究经验,她在计算机视觉、3D视觉方面的学术经历更加丰富,参与的去噪扩散隐式模型(DDIM)论文,如今单篇引用已有1700+:

除此之外,她还有多篇生成式AI相关研究发表在ICLR、NeurIPS、CVPR、ICML等顶会上,且多篇入选Oral。

当然,随着Pika 1.0爆火,Pika也开启了进一步的招人计划,从技术、产品到运营都有需求:

03 一个月内5家产品亮相

值得一提的是,不止是正在快速扩张的Pika。

就AI视频这个行业而言,这段时间来整体都迎来了一段“爆发期”。

据不完全统计,从11月至今,短短一个月的时间就已经有5家AI视频生成产品发布可能迎来大更新:

首先就是11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。

然后时间来到11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手,效果be like:

从Emu开始,大家都好像打起比赛来了,那叫一个争先恐后。

才过两天,11月18日,字节就半路杀出发布PixelDance,作品的动态性可谓史无前者,画面中的元素都动作幅度都相当大,且不变形,让人眼前一亮。

又仅过3天之后,11月21日,AIGC领域的佼佼者Stable AI也终于推出了自家的视频工具:Stable Video Diffusion。

效果嘛,也很能打。

同一天,Gen-2又没闲着,“横插一脚”上线“涂哪动哪”的运动笔刷新功能,直接标志出生成模型可控性上的一个重要里程碑。

最后,就是今天(Today)了,11月29日,来自创业公司的Pika直接带着网页版发布正式版1.0,叫板“老大哥”Runway。

在此之外,我们(We)还从未见过哪个阶段有这么多各有特色、来自不同背景的产品争相亮相。

这也让人不得不感叹一句:

AI视频这是来到爆发前夜了?

欢迎大伙畅所欲言~

参考链接:

[1]https://twitter.com/demi_guo_/status/1729546758718656530

[2]https://pika.art/blog

[3]https://twitter.com/mignano/status/1729510740246020403

本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技(Technology),36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+10

好文章,需要你的鼓励

量子位特邀作者5收  藏+10评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章LLM正在重塑培育,所有学生(Students)都需要学习AI,RAG是解决幻觉的关键首个获得驾照的AI,Agent担任私人助理样样精通,还能帮助考试作弊超越同级7B模型,祖国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能AI画画的工分都给人类记上,AI图片侵权第一案宣判推出供应链大模型产品「CubeAgent」,「壹沓科技(Technology)」想构建“员工+AI Agent”的智能办公方式 | 新科技(Technology)创业Nature重磅:17天独自创造41种新材料,AI再次赢了人类联手英伟达、ChatGPT 最强竞品 Claude,亚马逊云科技(Technology)开启生成式 AI 大决战WPS的AI路,与Office大不同马斯克、Grok与“数据封建主”最新文章推荐知名企业突发停工停产,在职人员超过2400名,公开电话已欠费停机...“流媒体电影(Movie)”逻辑变了,苹果亚马逊布局院线电影(Movie)合资们还在观望,大众独自醒来国产动画,在国外悄悄支棱起来了追忆查理·芒格:避免这25种“误导倾向”多多跨境的C位时间斯坦福美女博士创业项目爆火,AI视频生成出道即顶流,半年融资5500万美元36氪独家丨拓烯科技(Technology)再获亿元战略投资,一期特种环烯烃共聚物项目正式投产运行LLM正在重塑培育,所有学生(Students)都需要学习AI,RAG是解决幻觉的关键老年人的情与欲:超8成丧偶老人有再婚意愿,银发相亲需求爆发,“黄昏恋”生意如何做?量子位特邀作者

作者有点忙,还没写简介

发表文章1904篇最近内容斯坦福美女博士创业项目爆火,AI视频生成出道即顶流,半年融资5500万美元24分钟前北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务17小时前GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查18小时前阅读更多内容,狠戳这里下一篇36氪独家丨拓烯科技(Technology)再获亿元战略投资,一期特种环烯烃共聚物项目正式投产运行

达成自主工业化量产供货

27分钟前

热门标签支付结算拉勾网招聘信息boss直聘首都合租战狼2流利说马丁王子文拼好货媚者无疆末日生存阿泽语c曾鸣褚时健朱一龙白宇镇魂青云志麻雀首都社保审判日吴冰独立董事信用服务创新亦庄karabinercapslock关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2023 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

斯坦福美女博士创业项目爆火,AI视频生成出道即顶流,半年融资5500万美元

您可能还会对下面的文章感兴趣:

赞(800) 踩(26) 阅读数(5727) 最新评论 查看所有评论
加载中......
发表评论