方法存在时效性，现在可能失效！

虽然说这次数模校赛拿了二等奖第一名（要是一等奖能再多选一个人，我将绝杀，可是多不得），但是还要准备国赛鸭~
不过个人感觉大一第一次参赛能有这种成绩应该是很不错了hhh
鄙人不才，随便从网上整理了点资料，也不知道用不用得上233

数据查询

公开的数据库

1 国家数据

数据来源于中国国家统计局，包含了我国经济民生等多个方面的数据，并且在月度、季度、年度都有覆盖，较为全面和权威，对于社会科学的研究不要太有帮助。最关键的是，网站简洁美观，还有专门的可视化读物。

2 CEIC

最完整的一套超过128个国家的经济数据，能够精确查找GDP, CPI, 进口，出口，外资直接投资，零售，销售，以及国际利率等深度数据。其中的「中国经济数据库」收编了300,000多条时间序列数据，数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。

3 wind（万得）

万得被誉为中国的Bloomberg，在金融业有着全面的数据覆盖，金融数据的类目更新非常快，据说很受国内的商业分析者和投资人的亲睐。

4 搜数网

已加载到搜数网站的统计资料达到7,874本,涵盖1,761,009张统计表格和364,580,479个统计数据，汇集了中国资讯行自92年以来收集的所有统计和调查数据，并提供多样化的搜索功能。

5 中国统计信息网

国家统计局的官方网站，汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息，建立了以统计公报为主，统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。

6 亚马逊aws

来自亚马逊的跨科学云数据平台，包含化学、生物、经济等多个领域的数据集。

7 figshare

研究成果共享平台，在这里你会发现来自世界的大牛们的研究成果分享，同时get其中的研究数据，内容很有启发性，网站颇具设计感。

8 github

如果觉得前面的数据源还不够，github上的大神已经为大家整理好了一个非常全面的数据获取渠道，包含各个细分领域的数据库资源，自然科学和社会科学的覆盖都很全面，简直是做研究和数据分析的利器。

数据交易平台

1 优易数据

由国家信息中心发起，拥有国家级信息资源的数据平台，国内领先的数据交易平台。平台有B2B、B2C两种交易模式，包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。

2 数据堂

专注于互联网综合数据交易，提供数据交易、处理和数据API服务，包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据。

网络指数

1 百度指数

大家都很熟悉的指数查询平台，可以根据指数的变化查看某个主题在各个时间段受关注的情况，进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外，还有需求分析、人群画像等精准分析的工具，对于市场调研来说具有很好的参考意义。同样的另外两个搜索引擎搜狗、360也有类似的产品，都可以作为参考。

2 阿里指数

国内权威的商品交易分析工具，可以按地域、按行业查看商品搜索和交易数据，基于淘宝、天猫和1688平台的交易数据基本能够看出国内商品交易的概况，对于趋势分析、行业观察意义不小。

3 艾瑞咨询

艾瑞作为老牌的互联网研究机构，在数据的沉淀和数据分析上都有得天独厚的优势，在互联网的趋势和行业发展数据分析上面比较权威，艾瑞的互联网分析报告可以说是互联网研究的必读刊物。

4 友盟指数

友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析，对于研究移动端产品、做市场调研、用户行为分析很有帮助。除了友盟指数，友盟的互联网报告同样是了解互联网趋势的优秀读物。

5 爱奇艺指数

爱奇艺指数是专门针对视频的播放行为、趋势的分析平台，对于互联网视频的播放有着全面的统计和分析，涉及到播放趋势、播放设备、用户画像、地域分布、等多个方面。由于爱奇艺庞大的用户基数，该指数基本可以说明实际情况。

6 猫眼专业版

电影票房统计分析平台，猫眼专业版有实时的票房统计，影片的排盘情况、上座率和影院数据，对于当前电影的分析是必不可少的。

网络采集器

网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容，具有很好的内容收集作用，而且不需要技术成本，被很多用户作为初级的采集工具。

1 火车采集器

一款专业的互联网数据抓取、处理、分析，挖掘软件，可以灵活迅速地抓取网页上散乱分布的数据信息，并通过一系列的分析处理，准确挖掘出所需数据，最常用的就是采集某些网站的文字、图片、数据等在线资源。接口比较齐全，支持的扩展比较好用，懂代码的话，可以使用PHP或C#开发任意功能的扩展。

2 八爪鱼

简单实用的采集器，功能齐全，操作简单，不用写规则。特有的云采集，关机也可以在云服务器上运行采集任务。

3 集搜客

一款简单易用的网页信息抓取软件,能够抓取网页文字、图表、超链接等多种网页元素，提供好用的网页抓取软件、数据挖掘攻略、行业资讯和前沿科技等。

网络爬虫

作为极客们最喜欢的数据收集方式，爬虫高度的自由性、自主性都使其成为数据挖掘的必备技能，当然精通python等语言是必要前提。利用爬虫可以做很多有意思的事情，当然也可以获取一些从其它渠道获取不到的数据资源，更重要的是帮你打开寻找和搜集数据的思路。

1 利用爬虫爬取网络图片

爬取的图像素材你看到某个网站上的图片恰好是你需要的，但是量大单个下载太麻烦，那么利用爬虫你可以快速地进行抓取，并可以根据标签、特征、颜色等信息进行分类储存。从此不缺设计素材，不缺美女图片，连斗图都多了几分自信。

2 利用爬虫爬取高质量资源

我们总是想快速地去搜集高质量的网络资源，但是人工查找比对实在太麻烦，利用爬虫你就可以轻松解决。比如爬取知乎点赞最多的文章列表，爬取网易云音乐评论最多的音乐，爬取豆瓣网高评分的电影或图书……总之，你可以从此拒绝平庸。

3 利用爬虫获取舆情数据

比如你可以批量爬取社交平台的数据资源，可以爬取网站的交易数据，爬取招聘网站的职位信息等，可以用于个性化的分析研究。总之，爬虫是非常强大的，甚至有人说天下没有不能爬的网站，因而爬取数据也成为了很多极客的乐趣。开发出高效的爬虫工具可以帮助我们节省很多时间，可以完全按照自己的需求来订制，想想这个世界就太美好。

小工具

1 Web Plot Digitizer

比如我们在查看期刊文献的时候看到一张成型的图表，但其本身数据是缺失的，你想获得这个图表的相关数据怎么办？有了这个小工具就非常easy了。

2 you-get

pip3 install you-get
这是一个程序员基于python 3开发的项目，已经在github上面开源，支持64个网站，包括优酷、土豆、爱奇艺、b站、酷狗音乐、虾米……总之你能想到的网站都有! 还有一个黑科技的地方，即使是名单上没有的网站，当你输入链接，程序也会猜测你想要下载什么，然后帮你下载。

文献查询

【数学建模知识库】http://www.shumo.com/wiki/doku.php?id=start
【国赛官网】http://www.mcm.edu.cn/
【美赛官网】http://www.comap.com/
【美赛中文】http://www.mcmbooks.net/论坛
【数学中国】http://www.madio.net/forum.php
【校苑数模】http://www.mathor.com/mcm.php
【数学建模与统计建模论坛】http://www.mathsccnu.com/forum.php
【MATLAB技术论坛】http://www.matlabsky.com/源码
【源码搜搜】http://www.codesoso.net/
【Pudn】http://www.pudn.com/
【Wolfram】http://demonstrations.wolfram.com/index.html
【WolframAlpha】http://www.wolframalpha.com/文献
【谷歌学术】https://scholar.google.com/
【百度学术】http://xueshu.baidu.com/
【中国知网】http://www.cnki.net/
【万方数据】http://www.wanfangdata.com.cn/
【维普网】http://www.cqvip.com/
【Web of Science】https://www.webofknowledge.com/
【PubMed】https://www.ncbi.nlm.nih.gov/pubmed/
【ScienceDirect】http://www.sciencedirect.com/工具
【英文修改】http://www.1checker.com/
【搜索集成】http://so.chongbuluo.com/
【资料下载】http://www.hejizhan.com/
【国家数据】http://data.stats.gov.cn/
【谷歌镜像】http://dir.scmor.com/google/

搜索引擎之高级语法

只搜索同义词,不要原词 → ~词-词
在特定的网页标题中搜索 → intitle:
包含字词 → +
在特定文档格式中搜索 → filetype:
通配符字词 → *
加入类似字词 → ~
精确匹配 → 「」 （这里是双引号，因为后期美化的问题可能显示为方括号）
只显示在URL地址里有搜索结果的页面 → allinurl:
相关网页搜索 → related:
排除字词 → -
在特定url链接中搜索 → inurl:
在特定网站或域名中搜索 → site:
返回所有链接到某个URL地址的网页 → link:

数学建模相关资料查找方法

数据查询

公开的数据库

1 国家数据

2 CEIC

3 wind（万得）

4 搜数网

5 中国统计信息网

6 亚马逊aws

7 figshare

8 github

数据交易平台

1 优易数据

2 数据堂

网络指数

1 百度指数

2 阿里指数

3 艾瑞咨询

4 友盟指数

5 爱奇艺指数

6 猫眼专业版

网络采集器

1 火车采集器

2 八爪鱼

3 集搜客

网络爬虫

1 利用爬虫爬取网络图片

2 利用爬虫爬取高质量资源

3 利用爬虫获取舆情数据

小工具

1 Web Plot Digitizer

2 you-get

文献查询

搜索引擎之高级语法

2020第十一届蓝桥杯省赛模拟赛试题

建站100天

Comments | NOTHING

取消回复

数据查询

公开的数据库

1 国家数据

2 CEIC

3 wind（万得）

4 搜数网

5 中国统计信息网

6 亚马逊aws

7 figshare

8 github

数据交易平台

1 优易数据

2 数据堂

网络指数

1 百度指数

2 阿里指数

3 艾瑞咨询

4 友盟指数

5 爱奇艺指数

6 猫眼专业版

网络采集器

1 火车采集器

2 八爪鱼

3 集搜客

网络爬虫

1 利用爬虫爬取网络图片

2 利用爬虫爬取高质量资源

3 利用爬虫获取舆情数据

小工具

1 Web Plot Digitizer

2 you-get

文献查询

搜索引擎 之 高级语法

2020第十一届蓝桥杯省赛模拟赛试题

建站100天

Comments | NOTHING

取消回复

搜索引擎之高级语法