大数据时代读书心得体会

笔构网

2026-01-06心得

请欣赏大数据时代读书心得体会(精选7篇),由笔构网整理,希望能够帮助到大家。

大数据时代读书心得体会 篇1

我主要读了第一部分和第三部分。

第一部分是大数据的思维变革,作者舍恩伯格提出了三个观点,一是"不是随机样本,而是全体数据",二是"不是精确性,而是混杂性",三是"不是因果关系,而是相关关系",作者被誉为"大数据时代的预言家",抛出的观点是掷地有声的,下面我将谈谈我对这三点的理解。

对于一,我们必须承认我们以往做的处理抽样数据得到结果的方法,是省时省力省钱的,而且判断结果是相对高精准的,如人口普查这一案例,如果采用全体数据进行统计分析的话,工作难度是相当大的,最后的结果也不会很满意,这是得不偿失的。但是随着数据处理技术的飞速发展,我们已经具备了处理大量数据的能力,如果在数据分析过程中采用全体数据,就能避免抽样数据可能由于选取偏见带来的非随机性,处理全体数据也必将成为一种趋势。用在国防生管理工作中,就是管理层要对每个个体都给予充分的关心与互动,对于优秀的固然要偏爱,但是对于较差的也要保持"不抛弃不放弃"的态度,让每一个个体都找到自己的定位与价值。

对于二,作者强调通过掌握更多的数据,暂时牺牲精确性,关注更多容易被忽略的细节,来做更多的事,得到更多的结果,也就是说我们要有一定的包容错误的能力。我们在收集数据时,要主动获取更多的数据,少加一些限制性条件,然后应用我们处理大数据的能力,或许会获得意想不到的结果。作者举了一个谷歌翻译系统的例子,通过英语作为中转,进行各语言之间的转换。此处的启发就是用我们最擅长的途径,不拘泥于特定规则,来达到我们的目的,也就是说我们要先认清自己,不去刻意的模仿,找出最适合自己的一套方法。

对于三,作者指出知道"是什么"就够了,没必要知道"为什么",乍一看这个观点觉得有点无脑,但是结合第二点就合理了,降低对精确性及原因结果的要求,通过对相关数据的广泛分析,进而得到更丰富更多元的结果。如购物时,系统的购物推荐,并不是肯定你会购买,仅仅是你感兴趣进而可能会买就足够了。其实作者对"相关关系"的强调,主要是大数据强大的预测能力,而且这种预测性能还是相当精确的。以上只是我用作者的观点佐证他自己的观点,证明其一定的合理性,但是我是不完全认同的,在航天领域,我们对成功率的要求是极高的,尤其是载人航天领域,我们必须做到万无一失,我们对每一个结果都会深究其根,找出原因。对于国防生体能成绩的分析也是如此,结果只是我们的一个评价机制,而最重要的还是产生这一结果的原因及过程。

第三部分是大数据的管理变革,本来以为作者会讲点如何通过大数据来改革管理机制和提高管理效率,没想到作者只是讲了大数据其实就是我们的隐私的暴露,提出了要让数据采集管理公司对数据的使用负起责任的解决途径。个人感觉,一是我们在平时要意识到个人隐私的保护,而是相关法律政策的完善,真正的让大数据服务我们的工作生活,而不是一种变相的威胁。

大数据时代读书心得体会 篇2

知道"是什么"就够了,没必要知道"为什么"。在大数据时代,我们不必非得知道现象背后的原因,而是让数据自己"发声"。这个命题是我读这本书最大的感触。

对于大多数人来说,这的确是一场思维变革。对于理科学生来说,会认为这是一个错误的观点,因为这无异于否定了他们对世界客观物理化学规律探索的重要性;对于一名工科学生,其实这并不是一个多么新颖的观点,因为工科是讲求时用性的,如何能更好地利用基本自然科学规律创造社会财富比探索自然科学知识显得更重要。

这些天来,在读大数据这本书的同时,也稍微重温了一下自动控制原理,认识到控制系统中存在明显的大数据时代思维方式,借读书交流会之际,与大家分享。

对系统的有效控制需要对系统理解与建模。以一个日常生活中的例子说明。开车的时候一脚油门下去车就飞出去了,但并不知道这一脚油门下去能给多大车速,这就需要驾驶人员的熟练的驾驶技能了,不然超速被开罚单是很正常的。那么,问题就来了:如何能实现速度的自动控制而不用驾驶人员踩油门?这就是控制系统最关键的环节——建立系统数学模型。大白话就是知道车速与燃油量的数学关系式。若是以探索为什么的思维模式,不可避免的要列一大堆能量方程、动量方程等物理化学式子,经过繁杂的计算,还是能得到车速和燃油量的数学关系式的。很明显这是一个繁琐的过程,因为得知道现象背后的原因。这仅是对于这种简单的系统,若是对于航空发动机这种复杂的系统,结构工艺过于复杂,分析各部分的物理化学过程是十分困难的,这时候可以通过实验法得到数学模型。

实验法主要有时域测定法、频域测定法和统计相关法。与大数据时代思维最接近的是统计相关法,主要过程是对被研究对象施加某种随机信号,根据被测对象各参数的变化,采用统计相关法确定被测系统或对象的动态特性。这种方法可以在被测系统或生产过程正常运行状态下进行在线辨识,测试结果精度较高,但要求采集大量测试数据,并需要相关仪和计算机进行数据计算和处理。

若用开车实例来解释,此时的系统为汽车动力系统,施加的随机信号为燃油量,被测对象指车转速,得到的动态特性就是指车速与燃油量函数关系式,从而不用探求背后的物理化学规律就得到了数学模型。

在沈阳黎明航空公司实习时去过试车间,除了发动机点火后震撼的场景动人心魄,控制室屏幕上海量的数据也同样引人注目,我想这么多数据无非就是验证数学模型或直接实验法得到数学模型,结合航空发动机这种复杂的系统,对于搞控制的人来说,得到数学模型就够了,现象背后的原因交给研发的人来探索更好。

大数据时代读书心得体会 篇3

我们生活在一个“概念”纷飞的年代,先前只有IBM熟谙的招数,如今已经“飞入平常百姓家”。“移动互联网”、“云计算”的概念刚刚消停,业界的专家又送来了“大数据”的概念,一时间似乎人人都变成了“大数据”专家,见面要是不提“大数据”都不好意思跟人打招呼!

玩笑归玩笑,当我们的存储能力、计算能力和网络带宽变得充裕之后,我们先前对待数据,尤其是原始数据的态度和思维方式,将面临着很大的改变!

其实,作者的主要观点,已经在翻译者的译者序中进行了总结:“大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果”。

如作者所言,“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”。如果可以,我们当然会使用“全体数据”而不是“抽样数据”。读到这里,我估计大学里正在绞尽脑汁设计样本抽样方法的学生、教授们,连哭的心都有!

数据分析的及时性,在很多情况下比精确性更加重要,尤其是在商业领域。想想看,如果需要两周时间才能计算出明天某个航班的满座率,那还有什么意义?大数据计算技术,适用的不是像卫星发射、开具银行账户这样的工作,而是不要求极端精确的情况,其核心是“预测趋势”,况且原始数据也可能出现差错。

过往千年,探究因果关系几乎是所有科学研究的原动力。甚至,这已经通过语言,融入我们的思维方式和哲学思想:“因为……所以……”,凡事都要问“为什么”。但是,在大数据的范畴里,关注的却是相关性,而不是因果关系,或者其次才是因果关系。超市只用关心把啤酒和尿不湿放在一起,会帮助提高销售额,而不用关心其中的奥秘。如果说原因,可能很多都是人们的习惯、方便,甚至是人性,例如奶爸们习惯买尿不湿的时候给自己捎上几罐啤酒。

在此,也有一些自己的思考:如果说搜索引擎所解决的问题表面上是帮助用户找到需要的信息,而实质是帮助企业找到拥有某项需求的客户,深层次讲是解决了《第三次浪潮》中提出的消费者和生产者分离的根本矛盾,如果再加上3D打印技术,就可以完成由消费者主导的“个性化”生产过程;而大数据所解决的是,通过对所有用户的数据进行分析,可以预测用户群整体的需求变化趋势,从而完成批量产品生产、销售的调整问题,其奇妙之处就在于无需用户“开口”说出她想要什么?一个解决的“个体需求”,一个解决的是“群体需求”。

本书除了提出上述三项基本观点,其它的内容大多是举例说明,多少有些空泛。但是,其实大数据时代才刚刚开始,对大数据的应用也只是停留在比较浅的层面上,作者能提出这三项基本观点已属难能可贵!

大数据时代读书心得体会 篇4

读完这本书并不是一气呵成的,第一次读到大约五分之一的时候就放下了,第二次重新开始读,读到三分之二的时候又想放弃,可是想了想,还是坚持了下来,不为别的,看到三分之二的时候基本明白了书中要讲的主要内容,而这内容并不是我想从书中获知的,或者说,书中内容与我期待相去甚远。而之所以能硬着头皮读完,完全是出于想着事后跟朋友评论这本书的时候更有资格而已,毕竟,没有看完一本书而去评论它总是有失公正的。

大数据时代这本书按我自己的理解主要讲了四个方面的内容,一是讲什么是大数据,举了很多例子说明我们已经进入大数据时代了。二是讲大数据的意义,文中大量举例,论证大数据对人类发展的积极意义。三是讲大数据若是用得不当所产生的消极影响。四是提醒我们如何避免大数据的消极作用,发挥它的优势造福人类。记得高中学政治的时候,有一条回答问题的黄金法则,当要解决一个问题的时候得从三方面回答,那就是:是什么,为什么,怎么样;也就是先解释事务的定义,再说解决问题方法,最后阐明这个事务的积极作用和消极作用。而大数据时代只说明了两个问题,那就是,"是什么”,以及“为什么”。也许这本身就不是一本工具书。大数据时代,这个名字取的是够大气,内容却不敢恭维。这本书在网上炒的也很火,受很多人追捧,不知道看完之后是不是跟我一样,感觉看与不看似乎影响不大。

跟老公谈论过这本书,刚开始我在京东上买它的时候很激动得对老公说,看完这本书我会更了解现在互联网思维,对工作有帮助,而等我读完,一点这样的感觉都没有了。老公也很形象描述了这本书,它就像美食节目《舌尖上的中国》一样,告诉你哪里有好吃的,但是不告诉你怎么做。我觉得这个比喻很形象,真是要人命了,看着一道道美食而不得,只能拿起身边的薯条可乐解解馋的痛苦就是如此。

大数据时代读书心得体会 篇5

信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?

信息和数据的定义。维基百科解释:信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始的处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否是《大数据时代》一书所未曾阐述的背景材料?

在《大数据时代》一书中,大数据时代与小数据时代的区别:

1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举。

2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。

3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。

4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。

数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。

大数据时代读书心得体会 篇6

通过读ViktorMayer-Schonberger的《大数据时代》重新认真思考了大数据,全书以数据为核心,引导人们用数据的思维去理解世界,用数据的思维去解决问题,是推荐读物。但个人认为本书叫《数据时代》更为合适,因其讲了不少统计学、数据收集的故事,“大数据”的故事只占一小部分。

维基百科说大数据由巨型数据集组成,这些数据集大小常超出常用软件在可接受时间下的收集、庋用、管理和处理能力,或称巨量数据、海量数据、大资料,大数据的常见特点是3V:Volume、Velocity、Variety。

规模巨大的数据未必是大数据,需满足她的三个特点。以研究掷硬币概率的实验为例,当传统实验次数达到一定规模后就能帮助实验者分析正反面出现的概率,随着实验次数的增加,数据大量积累可能越来越支持这一结论,数据达到一定量,它的边际效应就出现了,数据继续增加对分析概率还有多少意义呢?按照现代概率学伯努利试验去带入函数计算就好了,这仅算是概率学或者是统计学吧。故大数据不是因为单纯体积大而大,是因为杂而大,研究硬币正反面的概率如引入天文学、心理学、材料学、物理学等领域的数据而使之变大,进而研究关联关系(或因果关系,注:本书不认同因果关系的重要性),从而得出概率的分布,然而大量相关数据的引入,按照传统分析过程的时间是不可接受的,需利用高效计算资源,迅速把杂而大的处理结果呈现出来,并且实验者对结果的预期不能要求100%的精确。大数据并不是数据本身,而是一种思维方式。

大数据令人着迷的地方在于用“科学”的办法挑战了“预测学”,帮助人们发现未知,帮忙人们进行决策。然而本书作者ViktorMayer-Schonberger强调“大数据不是因果关系,而是相关关系,相关关系比因果关系更重要”,此观点不能认同,因果关系是宇宙的基本定律,且不说种瓜得瓜、善有善报之类哲学命题,若商家在发现电容器、钉子、高压锅有关联购买关系而去做大量营销的话岂不是有可能发生更多的波士顿爆炸案①。关联关系在大数据中被提取出来使用,而不去关心因果关系是一种粗暴的、倒退的处理方式,是作者理解的现代社会浮躁的心里体现。我认为的大数据应该是把看起来不相干的数据放到一起分析,找到某些跨领域的关联关系,进而推论因果关系,发现其中价值。作者引用了安德森的观点“现在已经是一个有海量数据的时代,应用数学已经取代了其他的所有学科工具,而且只要数据足够,就能说明问题”,数据和所有科学的关系,我觉得有点像现在互联网和其他所有行业的关系一样,互联网终究还是一个工具。作者举了沃尔玛“尿布与啤酒”③的故事,这也是大家熟知的一个数据分析的故事,但是沃尔玛真的是这么做的吗?大家可以去沃尔玛的时候留意一下。一家大型的超市,如果为了这种所谓相关关系,所有商品用这种关联关系去摆放,天哪,这将是一家多么混乱的超市,顾客进去将难以区分食品在哪、生活用品在哪!有人可能说这种关联关系更适合电子商务,是的,但是我还是比较看好已知原因的关联关系,比如婴幼儿智力玩具和孕妇减肥放到一起,比如在线播放器旁边放卫生纸的广告(哈哈哈,你懂的)。本书用美国折扣零售店塔吉特与怀孕预测②来佐证他的观点,但恰恰是知道因果关系后商业价值才能更多的体现出来,未知因果关系前顾客的父亲生气并要求赔偿,知道因果关系后才使得这种广告理所应当并让客户接受。

互联网信息时代数据的积累以及BI、数据仓库、人工智能、HADOOP、NOSQL等技术的流行,使得人们考虑问题的方式已经发生变化,接下来我们要做的只有接受拥抱数据时代、大数据时代。软件行业程序上线的变更差错率是一个考核IT水平的指标,为此很多公司引进了CMMI体系,以求他保障软件的质量,为此也收集了大量的过程数据。若用数据的思维,是否可能根据之前的各种相关数据预测下次投产变更的成功率?若用大数据的思维,是否可以根据CMMI数据以及程序员开发期间上下班考勤数据、工资发放时间、上线当天天气情况来综合预测投产变更的成功率?用大数据的思维,订餐网站不仅根据之前你定的是咸的还是辣的来给你推荐菜单,可能因为你微博上发了一句“每个月总有那么几天”修改了订餐的推荐菜单(哈哈)!故在数据时代,提议童鞋们检查公司的信息系统,是否有定期删除“垃圾”日志、数据的机制(Viktor说,即使最平凡的信息业可以具有特殊的价值),为了日益廉价的存储而删除日益昂贵的数据,请三思后行吧。

大数据时代读书心得体会 篇7

4月13日下午,在湖南大学东楼205参加了关于《大数据时代》的读书交流活动。通过相互交流学习,使我更深层次的理解了大数据时代的利与弊,机遇和挑战。在写心得体会前,我想再重新审视一下关于大数据的历史沿革和现实意义。

首先,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后又IT行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。

其次,进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”

最后,随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……,截止到xx年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,xx年全球产生的数据量为0.49ZB,xx年的数据量为0.8ZB,xx年增长为1.2ZB,xx年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到xx年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB.IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了xx年,全世界所产生的数据规模将达到今天的44倍。

首先,谈谈大数据带给生活的转变。大数据已经是信息产业发展的必然趋势,可以说,大数据现在已经开始慢慢渗透入我们的生活,如:现在流行的打车软件、三维立体化社区的建立、某些从事生产销售的行业利用大数据来优化规模和实现利益最大化。而我们很多人对大数据还很陌生,只是被动的适应着大数据给生活带来的改变。大数据时代是以云计算为基础的,所以,要实现大数据,相关的很多的硬件设备都要更新换代,信息处理系统、信息传输系统、信息反馈系统、信息决策系统都将面临新的挑战,相关产业都要重新调整产业结构,在那时,可以夸张的说,信息就是黄金,信息就是石油。大数据时代的到来会解放更多的劳动生产力,势必将会更加加剧生产力过剩的现状,社会两极分化现象会更加明显,掌握不了信息资源,很难再翻身,要防止信息垄断带来的可怕局面。大数据时代的到来会使人们的生活节奏急速加快,信息的时效性决定了它的流通速率,人们的生活节奏要跟上信息流通的速率,就不得不加快自己的节奏,人们会越来越忙,到那时,就像现在的日本,可能想找个人听你说说话,真的是一件很难的事。

第二,关于数据管理的看法。大数据时代,数据管理是一件很重要的工作,如何才能避免自己的数据被非法窃取、丢失和被盗?我的看法是,人防、技防、物防一体化。人防,即我们要从思想上牢固树立信息安全防范的意识,不主动泄露信息,要管理好自己身边的信息设备;技防,就是要运用软件来管理和处理数据,经常检查更新数据库,定时查杀电脑病毒,确保电脑状况安全;物防,就是重要的数据一定要备份保留,而且应当做到备份与原始文件是物理隔离,无关的信息应当及时删除,减轻硬盘的压力。

三、怎么保护自己的隐私。隐私,顾名思义,就是不愿意让别人看到的东西,所以,在大数据时代,更要管理好自己的隐私,以免对自己和家人造成麻烦和损失。越是隐私的信息,越要远离网络,不要再公开的社交网络储存和展示个人图片、资料等信息,免得被非法人士采用和窃取。建议还是用纸质的日记代替电脑日记,避免信息传播范围太大,管理好自己的日记本。研发一种新的硬件连接器,总是以随机码来保护自己真实IP地址,提高网络安全的可靠性,加强对联网信息的管理和保护。

大家都在看