Thinking


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

flink学习笔记

发表于 2020-10-16 | 分类于 bigdata
Flink学习笔记1.初识FLinkFlink是什么Apache Flink是一个框架和分布式处理引擎,用于对无限制和有限制的数据流进行有状态的计算。Flink被设计为可在所有常见的集群环境中运行,以内存速度和任何规模执行计算。 Unbounded data: 有头无尾 Bounded data: ...
阅读全文 »

架构设计&分布式&数据结构与算法笔记

发表于 2020-07-19 | 分类于 bigdata
架构设计-分布式-数据结构与算法笔记架构设计请列举出在JDK中几个常用的设计模式?单例模式(Singleton pattern)用于Runtime,Calendar和其他的一些类中。工厂模式(Factory pattern)被用于各种不可变的类如 Boolean,像Boolean.valueOf,观 ...
阅读全文 »

ZooKeeper笔记

发表于 2020-07-18 | 分类于 bigdata
Zookeeper笔记1. ZooKeeper 是什么?ZooKeeper 是一个开源的分布式协调服务。它是一个为分布式应用提供一致性服务的软件,分布式应用程序可以基于 Zookeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列 ...
阅读全文 »

Tomcat笔记

发表于 2020-07-17 | 分类于 bigdata
Tomcat笔记Tomcat是什么?Tomcat 服务器Apache软件基金会项目中的一个核心项目,是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选。 Tomcat的缺省端口是多少,怎么修改 找到T ...
阅读全文 »

flume、sqoop笔记

发表于 2020-07-12 | 分类于 bigdata
flume、sqoop笔记1.什么是flumea.Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 b.Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中 c.一般的采集需求,通 ...
阅读全文 »

hive调优

发表于 2020-07-12 | 分类于 bigdata
hive调优 HIVE调优是一个很大的课题,涉及到hive本身的调优,hive底层的mapreduce计算引擎的调优,sql的调优,数据倾斜调优,小文件问题的调优,数据压缩的调优等 以下提供一些主要的调优总结: 1.数据的压缩与存储格式 hive底层的计算引擎是mapreduce,而mapreduc ...
阅读全文 »

数仓笔记

发表于 2020-07-11 | 分类于 bigdata
数仓笔记1.维表和宽表的考查(主要考察维表的使用及维度退化手法)维表数据一般根据ods层数据加工生成,在设计宽表的时候,可以适当的用一些维度退化手法,将维度退化到事实表中,减少事实表和维表的关联 2.数仓表命名规范每个公司都会有点差别 ODS ods.库名_表名_df/di/da/dz CDM(dw ...
阅读全文 »

Hbase笔记

发表于 2020-07-11 | 分类于 bigdata
Hbase笔记1.Hbase调优 高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。 ...
阅读全文 »

Kafka笔记

发表于 2020-07-10 | 分类于 bigdata
Kafka笔记1.Kafka名词解释和工作方式 Producer :消息生产者,就是向kafka broker发消息的客户端。 Consumer :消息消费者,向kafka broker取消息的客户端 Topic :咋们可以理解为一个队列。 Consumer Group (CG):这是kafka用来 ...
阅读全文 »

Spark笔记

发表于 2020-07-06 | 分类于 bigdata
Spark笔记1.rdd的属性 一组分片(Partition),即数据集的基本组成单位。对于RDD来说,每个分片都会被一个计算任务处理,并决定并行计算的粒度。用户可以在创建RDD时指定RDD的分片个数,如果没有指定,那么就会采用默认值。默认值就是程序所分配到的CPU Core的数目。 一个计算每个分 ...
阅读全文 »
1…456…8
Lx

Lx

dreamer

72 日志
12 分类
57 标签
GitHub
© 2019 — 2025 Lx
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4
人次 次