靓嘟嘟

当前位置: 首页 >> 直播资讯

优酷两美女教你接吻-高冷IT男成吻戏鉴定师一天标注几百张接吻图像

2024年05月09日 靓嘟嘟

29岁的吉恒杉有一份宅男梦寐已久的工作——坐在电脑前,将屏幕上成百上千幅内容各异的画面标注成两类——"接吻"和"非接吻"。他正在训练机器识别何为"接吻"镜头,因此也被戏称为"吻戏鉴定师"。

打开视频网站,不少片花、集锦以及进度条里的剧情提要,都离不开"吻戏鉴定师"的功劳。

机器对海量视频素材进行扫描,将吻戏等片段快速抓取出来,供小编们加工创作。

"刚开始我和女朋友说,我的工作是训练计算机识别出吻戏镜头,她听完觉得特别不可思议,谁能给钱让你干这个呢?"

吉恒杉2016年毕业于北京航空航天大学,硕士学的是计算机视觉,通俗地讲,这个专业的目的是"教电脑看懂世界"。去年9月加入阿里巴巴技术团队,成为优酷的一名高级算法工程师,主要工作是教计算机识别接吻等场景,也被称为"吻戏鉴定师"。

"这个岗位正好和我的专业吻合,给大家传递快乐和幸福,又能以工作的名义看网剧,我特别喜欢。"

这项看上去高冷的人工智能黑科技,在最初的环节真的需要不少"人工"。吉恒杉从图片库和视频中截出数千幅图片,从中一张一张标注出"接吻"的画面。这个过程叫做"数据标注"。

"一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。"吉恒杉说,通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

机器毕竟不是人,对有些复杂情况也无法识别。比如,为了拍出唯美画面,"接吻"这个姿态也千差万别,有的深情对视,而有的若即若离,团队里的"吻戏鉴定师"们不得不打印出角度各异的"接吻"画面贴在墙上,一群人激烈讨论到底怎么才算"接吻"。

机器学习了上千幅图片中的特征,这时再给机器任意一张"接吻"的画面,它就能认出来了。截止目前,吉恒杉和同事们已经为2万多条"吻戏"打上了标签。目前,5分钟时长的视频全链路处理可在10秒内完成。比如剧集《三生三世十里桃花》,每一集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

吉恒杉所在的团队目前有8个人。随着业务的快速拓展,"吻戏鉴定师"们也开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,以便网站小编制作比赛精彩集锦。

别看这份工作上看去轻松有趣,但其中的辛苦只有做过才知道。盯着电脑屏幕一整天,吉恒杉和同事们最轻松的时刻是下班后去健身房,或者去公司的"太空舱"按摩,享受片刻闲暇。即便是休息,他脑子里想的还是如何教机器"鉴别"更多的明星和场景。

这几年娱乐圈出现了一些新现象,比如,现在的明星长得越来越像,如何训练机器识别古力娜扎和迪丽热巴,如何分辨TFBOYS的三小只,需要不断试错和反复进行模型训练。区分"明星脸"、"网红脸"、"双胞胎",成了吉恒杉和同事们面临的新挑战。

  • 友情链接
  • 合作媒体