[Full]
完整版
[Rss]
订阅
[Xml]
无图版
[Xhtml]
无图版
Rss
& SiteMap
炒邮网论坛
http://bbs.cjiyou.net/
炒邮网论坛是收藏者使用量最多覆盖面最广的免费中文论坛,也是国内知名的技术讨论站点,希望我们辛苦的努力可以为您带来很多方便
◎
炒邮网论坛
→
市场热点
→
南方所:南方报业传媒集团南方网系统开发技术及数据采集服务项目采购公告
共1 条记录, 每页显示 10 条, 页签:
[1]
[浏览完整版]
标题:南方所:南方报业传媒集团南方网系统开发技术及数据采集服务项目采购公告
1楼
123456
发表于:2019/6/12 22:09:00
一、项目名称
南方报业传媒集团南方网系统开发技术及数据采集服务项目
二、项目简介
南方报业传媒集团南方网为配合云平台数据库建设工作,服务于双创政策数据库建设,需采购系统开发技术服务,包括政策数据采集及新闻网站数据采集技术服务。采集内容约991个数据源,需具有数据筛选及分析功能,满足数据库建设的使用功能,现公开询价。
三、合格供应商(同时满足以下条件)
1、在中国境内注册成立的,具有独立法人资格的企业;
2、提供资讯新闻大数据采集服务项目案例。
3、可提供增值税专用发票。
4、不接受联合体竞价、分包、转包。
四、服务要求
1.数据来源有991个,主要为国内公开出版发行的报纸、网站、社交平台数据,包括各公开政策、文件、规划、措施、制度和关于政策、项目各方需求的资讯等。
2.抓取的规则:
见附件1
。
3.抓取的时间:从公开的全网已有的历史数据开始抓取,直至现在。
4.服务时间:合同期一年。
5.抓取的数据量:第一批需要爬取的数据含历史数据及更新至目前的数据约22万条,之后将视各数据源更新情况而定。
6.抓取的内容:
(1)目标数据源清单,进行相应字段的提取,包括标题、公文号、摘要、关键词、正文、政策目录、发布机构、行政层级、发布区域、发布时间、政策领域、公文类型、附件、政策解读等。
(2)来源标题、发布时间、来源正文、资讯内容、回复内容、来源链接、摘要、关键词、发布来源、唯一ID等。
7、数据处理方式:通过爬虫等技术把全网的历史数据及实时更新的数据进行爬取,并进行数据清洗处理为半结构化数据,采用接口方式实时向我方进行推送。
8、交付方式:服务商在规定的时间内完成项目所需的字段提取,经双方确认数据接口正常使用及数据内容质量稳定后,视为验收合格。
9、其他要求见合同主要条款:
见附件2
。
五、报价要求
符合条件且有兴趣参与本项目的服务商,请下载本公告
附件3
《
南方报业传媒集团南方网系统开发技术及数据采集服务项目
的报价函》,按照该函的要求填写并附相关材料,加盖公章后,于
2019年6月17日17时
之前将报价函密封(封口加盖骑缝章,并在外面注明项目名称和联系方式)后送至或快递到我集团物资采购部,地址:广州市广州大道中289号南方报业传媒集团1号楼15楼,
联系人:
黄先生(18613198938)或
蓝先生(13632286082)。
南方报业传媒集团物资采购部
2019年6月11日
附件
附件1:数据字段爬取规则说明
附件2:主要合同条款
附件3:系统开发技术及数据采集项目报价函
共1 条记录, 每页显示 10 条, 页签:
[1]
Copyright ©2002 - 2010
炒邮网论坛
Powered By
Dvbbs
Version 8.0.0sp1
Processed in 0.09375 s, 2 queries.
[Full]
完整版
[Rss]
订阅
[Xml]
无图版
[Xhtml]
无图版