大数据

关系型数据库还是 NoSQL

TODO

很多时候采集到的数据是非结构化的，或者结构差异较大的。例如，某些商品有条码数据，而有些没有。

是否对于原始数据更适合采用 NoSQL 存储，而对于待展现的数据更适用关系型数据库存储?

TODO

TODO

数据量可能要求并不大，但是对实时性和准确性要求很高?

TODO

所以，收集整理常见数据的提取规则很有价值，例如，电话号码的正则、邮箱的正则等。

2014 年 Spark 代替 MapReduce 成为了 Hadoop 的缺省引擎。Spark 解决了 MapReduce 大量硬盘 IO 的问题。

Spark 支持 HBase, Cassandra 等等。

大象工具微信公众号

我是来自山东烟台的一名开发者，有感兴趣的话题，或者软件开发需求，欢迎加微信 zhongwei 聊聊，查看更多联系方式

生活	跑步清单足球鲁班探索孤独的美食家驾驶电视剧收纳奶爸健康 game 电影周末 joke
Geek	健身 Laravel Git Vim MySQL Linux UI Windows SVN 纪录片管理 Shell 游记工具手机 BackboneJS 自建博客 Mac DNS Tornado CDN Django Python AngularJS 理财前端 Nginx 爬虫 Redis Javascript Browser 浏览器推广 OAuth CSS PHP Social Networks 安全运维创业杂记 VueJS Android Image IDE Java ReactJS 数据分析 SQLite RESTful 读书笔记家电 ecshop Vagrant wordpress docker SEO GTD magento mongodb nodejs weex 冷知识 ruby iOS 微信小程序 AI CMS 快应用 backpack 广告联盟 OA 短信 UWP Win CSharp Tampermonkey graphviz 钉钉 WPS 数据字典微信公众号 Fuchsia Adobe XD SQL Server thinkphp 代码规范商业模式 Flutter 头痛的问题 serverless 视频制作国际化 golang 服务器 Kotlin 网站建设 5G 笔记本图片 spark spring 物联网 InfluxDB 图像识别 postgre rust 提示词
成长的烦恼	闲言碎语待产不睡觉写作程序员孙心然语录原则大鸿语录
地球	植物时间中文赚钱国家地理烟台一生伏首拜阳明 emoji 弟子规英文国际贸易