2025-06-18 23:57:04 时尚 69
大数据是大数指“无法用现有软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量复杂数据集。”业界通常用四个V(即成交量、型特品种、价值、速度)来概括大数据的特征。kag 一是庞大的数据量。到目前为止,人类生产的所有印刷材料的数据量为200PB(1PB=210TB),而人类在历史上所说的所有文字的数据量约为5EB(1EB=210PB)。目前典型的个人电脑硬盘容量为TB,而一些大企业的数据量接近EB。kag 第二,数据类型很多。这种多样性还允许将数据分为结构化数据和非结构化数据。与过去易于存储的结构化数据相比,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等。这些各种类型的数据对数据处理能力提出了更高的要求。kag 第三,价值密度低。该值与数据总量成反比。以视频为例。对于一个小时的视频,在连续监控中,有用的数据可能只有一两秒钟。如何通过强大的机器算法更快地完成数据的价值净化,成为大数据背景下亟待解决的问题。kag 第四,处理速度快。这是大数据区别于传统数据挖掘的最显著特征。根据IDC《数字宇宙》报告,预计2020年全球数据使用量将达到35.2ZB。面对如此海量的数据,数据处理的效率是一个企业的生命。kag |
上一篇:全国知识产权代理“蓝天”专项整治行动现场推进暨联合监管活动在广州举办
下一篇:“指定管辖格式条款”系列报道 | “指定法院管辖”条款涉嫌不公平对待消费者 涉及爱奇艺、顺丰、搜狐视频等30余家企业
紧跟华为脚步 三星三折叠手机或有限地区发售
中国首辆永磁高铁下线 最快3年商业化运营
第三届金砖国家财经论坛将于12月15日在北京举办
中国核电抱团走出去呼声再起 三巨头谁都不理谁
《毁灭战士:黑暗时代》Steam获玩家“特别好评”
英媒:中国互联网巨头正赶上硅谷
迅雷再登“黑榜” 盗版链条扭曲影视下载行业
陌陌赴美上市前夕网易发声明控诉唐岩
外交部:中方和欧洲议会决定同步全面取消对相互交往的限制
个人境外投资怎么玩 个人海外直投细则未明确
福建官员:国家领导决定在粤闽津试点自贸区
南北车恩仇:海外打价格战曾遭国务院批评
“高效办成一件事”跑出便民加速度_
獐子岛“偏袒”扇贝 海参鲍鱼不答应
苏宁云商三季度线上增长超52% 转型进入加速度
P2P泡沫隐忧出现 盈利模式“异化”问题重重
宿州:贯彻落实中央一号文件精神 谱写乡村振兴新篇章
西门子等多款品牌电梯被伪造 销往内地多省
白酒三季:茅台净利跌仍最赚钱 水井坊酒鬼或带帽
原油价格狂泻30% 美国“油比水贱”
中东部地区有雨雪 寒潮将影响我国大部地区
报告显示男女薪酬差距在世界各地根深蒂固
青海奶农因牛奶滞销倒奶卖牛 奶价比矿泉水便宜
中法德争夺中东3000亿美元铁路市场 日本几无存在感