百度AI市场

语音标注采集方言采集标注小语种

项目要求为规定时间内收集100万句儿童短语音,每条不低于15秒,合作方预估时间30天,实际完成时间25天,并对其进行标注,标注时间预估30天,实际完成时间20天。

1.一组20张照片,每人最少需要合格三组。

 

2.睁眼的表情需要注视镜头

 

3.拍摄距离准确

 

4.每组照片必须切换不同的背景,背景不可以高度重复

 

【采集要求】

 

1. 基本信息

 

采集类型

 

单人脸表情图像采集

 

采集周期

 

5.26-6.30

 

采集数量

 

4500组(至少375

 

采集设备

 

华为P40手机

 

单人拍摄量

 

12组(每组20张照片)

 

照片格式

 

jpg

 

2. 采集内容

 

拍摄7种不同表情,覆盖12种场地、4种光线、6种距离、7个人脸角度等。采集时会提供采集明细,需严格按照采集题目操作,可通过APP采集

 

注意:一组20张照片,需要全部合格该组才可以结算,每人最少需要合格三组

 

2.1 表情

 

·平静、微笑、哭泣、惊讶、闭眼、侧脸、其他自然表情

 

·表情自然、注视镜头拍摄(闭眼除外)

 

  2.11 侧脸表情要求

 

    · 人脸方向:左、右、抬头、低头、左歪头、右歪头

 

     · 左右脸角度不可大于30°、抬低头角度不可大于20°、左右歪头角度不可大于45°

 

 2.2 光线

 

·正常光、强光、弱光、逆光

 

·无论哪种光线,人脸必须清晰可辨别,不可过明/过暗

 

2.3 距离

 

·0.2~0.5m0.5~1m1m~1.5m1.5~2m2~2.5m2.5~4m

 

·准备支架、蓝牙遥控等,保证拍摄距离准确、无抖动

 

2.4 性别

 

· 男女比例1:1

 

2.5 年龄

 

· 18~30岁:40%

 

   31~45:30%

 

    46~60岁:30%

 

2.6 镜头

 

· 前置、后置

 

 2.7 场地

 

· 室内:卧室、餐厅、客厅、教室、会议室、商场等,室外:公园、街道、操场、球场、车库、停车场等

 

· 室内:室外=1:1,并且整体数据必须覆盖12个场地以上

 

· 每组照片必须切换不同的背景,背景不可以高度重复

 

3. 其他要求

 

· 正式采集时需每天提供第三角度采集现场照片及视频

 

· 提供采集人员签字的授权书

 

· 每个人需要登记好编号,不可以重复

 

【数据采集隐私要求】

 

 1.严禁出现身份证号、车牌号、明星、政治人物等敏感信息。

 

2. 严禁在军事场所、保密区域或其他有标识禁止拍照的地点采集数据。

 

1. 全程正脸直视手机  2.提交前检查每一张照片 3.注意暗光必须面部清晰 4.表情区别大,距离符合要求 。 5.第三角度照片别忘记上传  特别强调前置和后置及距离注意,表情、距离按发的小图样式操作,转头和歪头是不一样的

  同一场景的两组光线区别特别明显,窗前不利用暗光,注意年龄和室内外的比例