发布日期:2021-10-21
一、项目基本情况
原公告的采购项目编号:ZF2021-06-0651
原公告的采购项目名称:中国科学技术大学多语种语音语言数据库采购
首次公告日期:2021年10月14日
二、更正信息
更正事项:采购文件
更正内容:
我公司现对中国科学技术大学多语种语音语言数据库采购招标文件做出如下答疑澄清。此次答疑澄清作为招标文件的组成部分,具有同等效力。答疑澄清与招标文件不同之处,按本次答疑澄清内容执行。
项目答疑澄清内容如下:
标包1、2:
1. 分段内容是仅打点+标签还是完成切音,交付切音后文件?
答复:交付的单条音频格式是按照标注要求完成打点切分和标注的3分钟音频文件和对应标注结果的textgrid文本文件。
2. 特殊书写方式有哪些?具体统一标准是我方提供标注词典还是客户提出统一要求?
答复:如有特殊书写方式,由中标单位与我方沟通一致后,由中标单位提供标注词典。
3.招标方的查重手段及重复判定标准是什么,比如两句话如果按文字重复的话重叠比例多少才算重复?
答复:将文本的内容去除标点、标签等字符后,用莱文斯坦距离得出重复率;重复率高于等于50%,视为重复。
4.验收具体实施中的自检报告是指什么?和第三方检测机构的检测报告是同一份报告么?
答复:自检报告指的是中标单位自己针对验收项进行的数据质检结果,自检报告和第三方检测机构的检测报告非同一份。
标包4:
1.平均每张图每行清晰字符不少于 20 个字符—对于某些类别图片很难达到,比如名片、菜单等(中文 OCR 一般平均一行文字很难超过 20 个字符);
答复:特殊场景除外,不做每行字符数要求。
2.所有场景图片中,需覆盖模糊(运动模糊,失焦模糊,拍摄对象本身模糊等)及光线问题(反光、暗光、亮光、亮暗交替等)图片—是否可以理解为自然采集即可,无其他比例限制。
答复:涉及即可,没有比例要求。
3.如一行文字中出现了几种不同的语种选择哪个类别?
答复:以占比最高的语种为主,如果比例五五开的语种,一行内按语种拆分,分别拉框标对应语种属性。
4.如一行文字中出现了部分文字不是需求语种,如何标注?
答复:若占比较大则属于other language,如占比较低,一行框,属于需求语种。
5.图片分辨率有没有要求。
答复:没有强行要求,内容可辨识即可。
6.标注属性:语种信息、文字排版横竖走向、涂抹、反光、模糊、公式,有无其他属性?
答复:没有反光属性,反光情况文字可辨识为涂抹横/竖属性,不可辨识为模糊属性,还有多点属性和其他语种属性。
7.采集场景是否有比例要求;
答复:无。
更正日期:2021年10月21日
三、其他补充事宜
无
四、凡对本次公告内容提出询问,请按以下方式联系。
1.采购人信息
名 称:中国科学技术大学
地址:合肥市金寨路96号
联系方式:郭武:0551-63607871
2.采购代理机构信息
名 称:安徽省招标集团股份有限公司
地 址:合肥市包河大道236号
联系方式:应急客服电话:0551-62220153(接听时间:8:30-12:00,13:30-17:30,节假日除外。潜在投标人应优先拨打项目联系人联系电话,无人接听时再拨打该“应急客服电话”)
3.项目联系方式
项目联系人:刘志凌、魏思宇、张文奇
电 话: 0551-62220268、62220264、15324494256