当前位置: 首页 > news >正文

让别人做网站图片侵权哪些网站可以免费申请

让别人做网站图片侵权,哪些网站可以免费申请,个人做视频网站,台州北京网站建设文章目录 什么是Spark对比HadoopSpark应用场景Spark数据处理流程什么是RDDSpark架构相关进程入门案例#xff1a;统计单词数量Spark开启historyServer 什么是Spark Spark是一个用于大规模数据处理的统一计算引擎Spark一个重要的特性就是基于内存计算#xff0c;从而它的速度… 文章目录 什么是Spark对比HadoopSpark应用场景Spark数据处理流程什么是RDDSpark架构相关进程入门案例统计单词数量Spark开启historyServer 什么是Spark Spark是一个用于大规模数据处理的统一计算引擎Spark一个重要的特性就是基于内存计算从而它的速度可以达到MapReduce的几十倍甚至百倍 对比Hadoop Spark是一个综合性质的计算引擎Hadoop既包含Mapreduce(计算)还包含HDFS(存储)和YARN(资源管理)两个框架定位不同从综合能力来说Hadoop更胜一筹计算模型Spark任务可以包含多个计算操作轻松实现复杂迭代计算Hadoop中的mapreduce任务只包含Map和Reduce阶段不够灵活处理速度Spark任务的数据是存放在内存里面的而Hadoop中的MapReduce任务是基于磁盘的 在实际工作中Hadoop会作为一个提供分布式存储和分布式资源管理的一个角色存在Spark会依赖于Hadoop去做计算。 Spark应用场景 低延时的海量数据计算需求低延时的SQL交互查询需求准实时计算需求 Spark数据处理流程 什么是RDD 通常通过Hadoop上的文件即HDFS文件进行创建也可以通过程序中的集合来创建是Spark提供的核心抽象全称为Resillient Distributed Dataset即弹性分布式数据集 弹性RDD数据在默认的情况下存放内存中但是在内存资源不足时Spark也会自动将RDD数据写入磁盘RDD在抽象上来说是一种元素数据的集合它是被分区的每个分区分布在集群中的不同节点上从而RDD中的数据可以被并行操作容错性最重要的特性就是提供了容错性可以自动从节点失败中恢复过来。比如某个节点的数据由于故障导致分区的数据丢了RDD会自动通过数据来源重新计算数据 Spark架构相关进程 Driver我们编写的Spark程序由Driver进程负责执行Master集群的主节点中启动的进程Worker集群的从节点中启动的进程Executor由Worker负责启动的进程执行数据处理和数据计算Task由Executor负责启动的线程是真正干活的 入门案例统计单词数量 # scala 代码 object WordCountScala {def main(args: Array[String]): Unit {val conf new SparkConf();conf.setAppName(wordCount).setMaster(local)val context new SparkContext(conf);val linesRDD context.textFile(D:\\hadoop\\logs\\hello.txt);var wordsRDD linesRDD.flatMap(line line.split( ))val pairRDD wordsRDD.map(word (word, 1))val wordCountRDD pairRDD.reduceByKey(_ _)wordCountRDD.foreach(wordCount println(wordCount._1 --- wordCount._2))context.stop()} } public class WordCountJava {public static void main(String[] args) {SparkConf sparkConf new SparkConf();sparkConf.setAppName(worldCount).setMaster(local);JavaSparkContext javaSparkContext new JavaSparkContext();JavaRDDString stringJavaRDD javaSparkContext.textFile(D:\\hadoop\\logs\\hello.txt);// 数据切割把一行数据拆分为一个个的单词// 第一个是输入数据类型第二个是输出数据类型JavaRDDString wordRDD stringJavaRDD.flatMap(new FlatMapFunctionString, String() {Overridepublic IteratorString call(String line) throws Exception {return Arrays.asList(line.split( )).iterator();}});// 迭代word装换成word1这种形式// 第一个是输入参数第二个是输出第一个参数类型第三个是输出第二个参数类型JavaPairRDDString, Integer pairRDD wordRDD.mapToPair(new PairFunctionString, String, Integer() {Overridepublic Tuple2String, Integer call(String word) throws Exception {return new Tuple2(word, 1);}});// 根据key进行分组聚合JavaPairRDDString, Integer wordCountRDD pairRDD.reduceByKey(new Function2Integer, Integer, Integer() {Overridepublic Integer call(Integer v1, Integer v2) throws Exception {return v1 v2;}});// 输出控制台wordCountRDD.foreach(new VoidFunctionTuple2String, Integer() {Overridepublic void call(Tuple2String, Integer tuple2) throws Exception {System.out.println(tuple2._1 : tuple2._2);}});javaSparkContext.stop();}} Spark开启historyServer [roothadoop04 conf]# vim spark-env.sh export SPARK_HISTORY_OPTS-Dspark.history.ui.port18080 -Dspark.history.fs.logDirectoryhdfs://hadoop01:9000/tmp/logs/root/logs[roothadoop04 conf]# vim spark-defaults.conf spark.eventLof.enabletrue spark.eventLog.compresstrue spark.eventLog.dirhdfs://hadoop01:9000/tmp/logs/root/logs spark.history.fs.logDirectoryhdfs://hadoop01:9000/tmp/logs/root/logs# 启动 [roothadoop04 conf]# sbin/start-history-server.sh # 访问 http://hadoop04:18080/
http://www.yingshimen.cn/news/6070/

相关文章:

  • 怎么做自己的设计网站免费的erp系统
  • 济南网站建设丨 首选搜点网络wordpress 批量建站
  • 网站推广推广旅游网站如何做
  • 重庆建站网站流程及费用品牌形象
  • 网站关键词库是怎么做的莱芜seo排名
  • 司法网站建设与维护 教材域名和服务器的关系
  • 网站建设目标定位一网网站制作平台
  • 网站建设公司活动水电公司设计logo
  • 电子商务在线网站建设公司做的网站搜索不到
  • 做经营行网站需要什么做gif图的网站
  • 相亲网站用什么做的wordpress post 属性
  • 网站实现中英文如何快速网络推广产品的方法
  • 邯郸餐饮网站建设扁平化网站特效
  • 个人网站建设程序设计虚拟主机多个网站
  • 东莞网站营销推广课程微网站开发技术
  • 重庆的做网站公司网站开发过程的基本环节
  • 开设网站步骤外发加工网贴吧
  • 赫章县网站建设什么网站帮人做网页
  • 揭阳新站seo方案软文推广案例
  • 长沙h5手机网站制作广东深圳软件开发公司
  • 电子政务网站建设背景县工商局 网站建设
  • 有没有在家做的手工活网站深圳西乡地铁站
  • 自己建站模板自己创做网站
  • 企业自己怎么制作网站首页鄂州网页定制
  • 4s店网站建设计划html公司网页
  • 做网站代理怎么样外网浏览入口
  • 妹妹强迫我和她做网站电子商务网站排名
  • wordpress导出网站网络公司注册费用
  • h5响应式网站是什么家电网站建设需求分析
  • 辽宁城乡建设部网站商城网站建设需要注意什么