王姐姐 2024-04-28 09:08
Hadoop和Spark是大数据处理领域两个不同的开源框架,它们既有区别又有联系。两者在使用场景,处理速度,生态系统等方面有所区别。
大数据
(166)
(0)
0
王姐姐 2024-04-28 08:59
1.操作命令操作命令是以 hdfs dfs 开头的命令。通过这些命令,用户可以完成 HDFS 文件的 复制、删除 和 查找 等操作。
(136)
王姐姐 2024-04-10 10:45
目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确),这方面的中文资料很少见,希望对国内的朋友了解掌握推荐系统有帮助。
(219)
牛叔叔 2024-03-31 17:06
Apache Flink 是一个开源的流处理框架,由Apache软件基金会开发和维护,旨在为实时和批处理数据提供统一的计算引擎。Flink的设计理念是支持无边界和有边界的流数据上的有状态计算,这使得它特别适用于处理持续不断的实时数据流,同时也能有效处理传统的批量数据集。
(201)
牛叔叔 2024-03-31 17:00
Hadoop虽然一直是大数据处理领域的基石,但随着时间的推移和技术的发展,出现了一些新的或经过改进的分布式数据处理和存储解决方案,这些方案可以作为Hadoop某些组件的替代品或补充方案。
(453)
牛叔叔 2024-03-31 16:59
Hadoop是一个开源的分布式计算框架,主要用于处理和分析海量数据。这个框架由Apache软件基金会开发和维护,起初由Doug Cutting和Mike Cafarella创建,灵感来源于Google的MapReduce论文和Google File System(GFS)的研究成果。
(178)
王姐姐 2024-02-02 09:51
主要应用在异步处理、应用解耦、流量削峰、日志处理、消息通信等方面。
(243)
王姐姐 2024-02-02 09:11
吞吐量较低:Kafka和RabbitMQ都可以,吞吐量高:Kafka。
(252)
王姐姐 2023-12-10 11:53
ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana。Elasticsearch是个开源分布式搜索引擎,提供搜集、分析、存储数据三大功能。Logstash主要是用来日志的搜集、分析、过滤日志的工具,支持大量的数据获取方式。Kibana可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面,可以帮助汇总、分析和搜索重要数据日志。
(1147)
牛叔叔 2023-07-30 11:57
图灵测试(Turing Test)是由计算机科学家艾伦·图灵(Alan Turing)在1950年提出的一种测试,用于评估机器是否具有智能。图灵测试的目标是判断一个机器是否能够以人类的水平进行自然语言
(2841)
王姐姐 2023-04-26 15:04
在 Windows 下安装 Kafka 相对来说很简单,只需要下载 Kafka 的压缩包,然后解压到本地。同时,Kafka 可以使用 PowerShell 下的命令来管理 Kafka 服务。
(634)
王姐姐 2023-04-26 14:40
消息队列常见的使用场景其实有很多:系统解耦、异步处理、流量削峰、日志处理等。
(500)
王姐姐 2023-04-26 14:08
Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源 项目。
(389)
王姐姐 2023-02-13 17:42
操作redis过程中并没有修改什么配置,出现如下错误,Redis之MISCONF Redis is configured to save RDB snapshots, but is currently
(1189)
王姐姐 2022-03-14 17:25
Java 中的堆是 JVM 所管理的最大的一块内存空间,主要用于存放各种类的实例对象。
(904)
Page 1 of 2
王姐姐 2024-04-28 09:08
hadoop和spark的区别和联系
Hadoop和Spark是大数据处理领域两个不同的开源框架,它们既有区别又有联系。两者在使用场景,处理速度,生态系统等方面有所区别。
大数据
(166)
(0)
0