goback
月期刊咨询网
当前位置:首页>>计算机网络论文>>正文

网络工程师职称论文Hadoop云计算平台的研究及实现


所属栏目:计算机网络论文
发布时间:2014-08-29 15:54:39  更新时间:2014-08-29 15:30:38

已签订领域:化学工程/制药,医学题目:**作为抗癌剂***催化剂**取代苯丙***SCI四区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:用**电***生物传感器**癌症**SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:**氧化石墨烯纳米***材料的生物传感器***结肠癌生物**癌胚****SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:聚合物纳米***a-硫辛酸***在神经炎症***应用***临床分析SCI二区 直击了解更多选题

已签订领域:计算机视觉/遥感/智能驾驶/汽车题目:**深度学习***高分辨率遥感***车辆检***SCI三区 直击了解更多选题

已签订领域:企业管理题目:社会交流***领导***倾向***方向SSCI,SCI三区,二区 直击了解更多选题

已签订领域:企业管理题目:**中小企业社交媒体****可持续绩效***因素探析SSCI,SCI三区,二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:利用硫氨酸***石墨烯纳米***电化学***传感器实现癌胚抗原***SCI二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:基于抗***纳米复合***高性能***早起癌症诊断***SCI二区 直击了解更多选题

已签订领域:经济,能源题目:***政治冲突****绿色金融、金融**、气***化***SCI四区 直击了解更多选题

已签订领域:经济,能源题目:冲***中能源不安全对***和环境***SCI四区 直击了解更多选题

已签订领域:教育题目:大学生***社交媒体***成绩影响***SSCI三区 直击了解更多选题

已签订领域:教育题目:巴基斯坦***学习实施的***的**SSCI二区 直击了解更多选题

已签订领域:教育题目:大学生对****下网络教学**思***SSCI二区 直击了解更多选题

已签订领域:教育题目:**教师和学生对影响***医疗**效果的****看法SSCI三区 直击了解更多选题

已签订领域:计量经济学题目:**货币、黄金、**和美国***的波动***相互依赖性:**数据的分析SSCI一区 直击了解更多选题

已签订领域:计量经济学题目:东南亚***内**趋同***中等收入**:新**的***SSCI二区 直击了解更多选题

已签订领域:建筑,历史题目:历史景点在***旅游发***中的***影响**(**研究:**历史***)SSCI,SCI一区 直击了解更多选题

已签订领域:领导力,管理题目:量化**领导对角色绩效***响:**冲突与工作自主性***作用SCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:数字***环境对学生学习成绩***:游戏**和***现实在教育***作用SSCI四区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***续决策之间的***:创新***识的**作用SSCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:课程**对大学生***发展的影响:学习习惯和***的***作用SSCI一区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***与可持续决策**:高等***学生认知***作用SSCI二区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语****学**与人工智能****学习SCI三区 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐**对学生成绩***的影响SCI三区 直击了解更多选题

已签订领域:人体工程,心理学题目:基于预先处理模型***模式人体工程学***女生肌肉骨骼***预防行为*** 直击了解更多选题

已签订领域:人体工程,心理学题目:制定一个***人体工程学**,以识别、优先考虑***职业压力源的*** 直击了解更多选题

已签订领域:人体工程,心理学题目:多重工作**压力和工作***:***工效学方法的混合方法*** 直击了解更多选题

已签订领域:数学,经济题目:数学模型***结构调整和经济转型****研究 直击了解更多选题

已签订领域:数学,经济题目:***时间**数学模型在***媒体营销**中的应用*** 直击了解更多选题

已签订领域:数学,经济题目:***时间**模型在***物流运**能力***研究 直击了解更多选题

已签订领域:数学,经济题目:碳****经济的数学模型****研究 直击了解更多选题

已签订领域:农村经济题目:农****社区**发展***分**SCI四区 直击了解更多选题

已签订领域:农村经济题目:创业***对乡村****发展的****SCI四区 直击了解更多选题

已签订领域:农村经济题目:农村创业****的空间*****究SCI四区 直击了解更多选题

已签订领域:医学,电化学题目:纳米颗粒*****及其在癌症****和重金属*****检测中的应用SCI三区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****前列腺癌药物氟****检测方法的*****腺癌治疗SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:气海***********金纳米颗粒的新型****************粘土及其对胃癌********************抗癌SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于抗***********GCE纳米***********材料的高性能*******************早期癌症SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:用******电化学生物传感器*****癌症***************SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****石墨烯纳米****材料的生物传感******用于测定结肠*****生物*****SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:聚合***纳米复合电极*****疏辛酸电化学检测*********SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:利用****酸/**糖**石墨烯纳米复合修饰的电化学*****SCI二区 直击了解更多选题

已签订领域:环境能源,绿色投资题目:环境能源、绿色投资、城市化和环境类方向SCI三区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语教学**人工智能***习SCI 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐形式*学生***影响SCI三区 直击了解更多选题

已签订领域:经济,绿色投资题目:***能源效率***化之间的***SCI三区 直击了解更多选题

已签订领域:经济政策题目:***阐明**印度经济***的关系SCI三区 直击了解更多选题

已签订领域:经济,金融题目:***国家的能源***重***SCI 直击了解更多选题

已签订领域:经济,金融投资题目:***融新之间***直接投资***SCI三区 直击了解更多选题

已签订领域:经济,数学,统计学,管理学题目:非***想重限制下***袭评价***SSCI四区 直击了解更多选题

已签订领域:经济,数字,管理学题目:基干***生产系统***SSCI四区 直击了解更多选题

已签订领域:农业,土壤科学题目:不同***有机覆盖***养分循环SSCI 直击了解更多选题

已签订领域:电力与能源系统,管理题目:pv***氢定价的***随***型稀SSCI,SCI二区 直击了解更多选题

已签订领域:建筑规划,计算机题目:使用***因子分析法***可持续***SCI三区 直击了解更多选题

已签订领域:工程技术,纺织工程,材料科学题目:甘***淀粉酶的提取***退浆中的应用SCI四区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:饲料***镉毒性的交互***生长***病理学***SCI二区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:****鱼水源***起的生******SCI三区 直击了解更多选题

已签订领域:金融,环境经济题目:*****预算在能效、绿色***的作用SCI 直击了解更多选题

已签订领域:应用数学/计算物理题目:***非线性库***自相位调制***SCI三区 直击了解更多选题

已签订领域:计算机,医学检测题目:***COVID-19***力***算法***决策SCI三区 直击了解更多选题

已签订领域:计算机,物联网,智慧城市题目:基于***物联网****算法SCI三区 直击了解更多选题

  在大数据时代,数据动辄以T级计算,传统的集群技术已经难以存储、分析并处理如此大量的数据。为了提高集群系统中硬件资源的利用率,分布式文件系统得到了广泛的应用。Google公司先后提出了BigTable、GPFS以及MapReduce等分布式技术,为处理海量数据提供了宝贵的经验;Hadoop分布式系统框架也应运而生,并在日志分析、商业数据分析等领域得到广泛应用。

  摘 要 随着电子商务的兴起,传统的服务器集群技术在处理大数据时越来越显得力不从心。Hadoop是一种开源的云计算技术,包含HDFS文件系统及 MapReduce编程模型两大核心,在处理海量数据、数据挖掘、电商推荐系统等领域有其独到的优势。文章介绍了Hadoop的基本原理,实现了搭建了 Hadoop集群,从而实现了一个基于Hadoop的云计算平台。

  关键词 网络工程师职称论文,Hadoop,云计算,HDFS

  目前Hadoop集群应用最为成熟的是Yahoo公司,在其生产环境Hadoop集群中有超过4000台节点,对其业务运营、客户关系分析等有着重要的现实意义。Hadoop开源项目诞生以来,国内的研究开始较晚,加之国内多数研究机构、厂商等的谨慎保守态度,Hadoop生态系统在云计算领域的应用进展一直比较缓慢。Hadoop技术在国外如火如荼的发展表明,深入研究Hadoop技术的基本原理,实现一个基于Hadoop的云计算平台,有着重要的现实意义。

  1 Hadoop基本原理

  作为一种开源的分布式云计算技术,Hadoop能够在廉价的服务器上创建集群,实现集群的横向扩展。Hadoop集群主要包括两大核心:HDFS分布式文件系统和MapReduce计算框架。从Yahoo公司的Hadoop平台运行情况可以得知,Hadoop平台有如下优势:1)集群中的节点可以是廉价的商用机器,这些大量的机器组成的集群能够可靠地处理大规模数据文件;2)多个数据节点上可以并行处理同一个任务,具有高并发性,有效提高了工作处理周期;3)默认情况下,Hadoop集群中的数据块会有三个副本,这种备份机制提高了业务数据的冗余性,即使集群中的某一服务器发生故障,也不会造成数据丢失的情况。

  Hadoop集群在处理数据时,客户程序利用标准API将文件写入到HDFS分布式文件系统上,接下来借助MapReduce计算框架进行分布式计算得到结果。组成HDFS的节点按照功能主要分为三类:NameNode节点、DataNode节点以及Client节点。 NameNode是HDFS文件系统的主节点,它保存了HDFS文件系统中的元数据,管理着集群中目录及文件的分配,是整个文件系统的核心;DataNode节点存储了真正的业务数据,hadoop集群中的文件被分为多个数据块,每个数据块根据配置可以在多个DataNode节点上存储若干副本;与其他分布式文件系统一样,HDFS文件系统采用的也是主从架构:一个单一的NameNode节点作为HDFS文件系统的主节点,若干数量的 DataNode节点是从节点。NameNode 节点的内存中存储了整个HDFS文件系统的元数据,同时处理客户端的文件访问请求,并且与 DataNode节点进行通信;DataNode 节点采用心跳机制定时和NameNode节点进行通信,以此保证整个集群运行正常。NameNode节点在接收到Client的文件读写请求后,根据客户端请求的数据块和DataNode节点间的映射关系,通知存储了客户端请求数据块的DataNode,此DataNode节点响应并处理Client发起的文件读写请求,对数据块块进行读、写等操作。

  在使用HDFS文件系统的过程中,有几个问题需要注意:1)HDFS文件系统在读取文件时需要流式读取。HDFS之所以具有较高的性能,就是因为它放弃了随机读取文件的特性,所以读取文件时必须流式读取;2)Hadoop并不支持对关闭的文件进行更新,所以HDFS文件系统中的数据操作适合“一次写入、多次读取”的情况,另外,HDFS中适合存储少量的大文件,而不适合存储海量小文件。

  MapReduce计算模型包括“Map(映射)”和“Reduce(化简)”两部分,可以用于大规模数据集的并行运算。MapReduce 计算模型把主要功能都在Map函数及Reduce函数内实现,编写并行程序的开发人员无需了解系统运作的底层原理即可迅速完成开发工作。 MapReduce的数据处理主要包括map阶段和reduce阶段:map阶段将输入数据分为多个分片,并将一行行的输入转换为key-value形式;DataNode节点上存储的数据块对应一个map。reduce阶段归纳map阶段的输出,并合并具有相同key值的value。 MapReduce处理数据的流程如图1所示。

  图1 MapReduce处理数据的流程

  类似HDFS文件系统中的 NameNode和DataNode的主从结构那样,MapReduce计算模型也是由JobTracker和TaskTracker组成的主从结构构成。其中JobTracker运行在NameNode节点上,而TaskTracker运行在DataNode节点上。当Client有作业要完成时,JobTracker会先把此作业放到内部的作业队列中,在进行初始化后,交给作业调度器进行调度,作业调度器会先将任务进行分片,然后为每一个分片创建一个map任务。为了并行地处理大规模数据,MapReduce计算模型将比较大的任务分解为多个小任务,不在执行任务的各个组件间共享数据,从而可以方便地将各个子任务扩展到大规模的集群中。

  2 基于Hadoop的云计算平台

  Hadoop环境包括三种:单机版、伪分布集群以及完全分布环境。Hadoop单机版一般用于开发测试,Hadoop伪分布集群是在一台服务器上模拟分布式开发环境,Hadoop分布式环境才真正适用于云计算平台。接下来本文将实现一个Hadoop云计算平台。   首先,要在所有Hadoop集群的节点上安装必须的软件,包括JDK以及SSH。Hadoop源码的编译以及mapreduce任务的运行都离不开 JDK,所以必须按照JDK;安装完毕后,要在用户的.bash_profile文件中配置环境变量JAVA_HOME以及PATH,并执行source .bash_profile命令以使环境变量生效。另外,hadoop 需要利用ssh互信来启动各个slave主机的守护进程。

  安装 Hadoop集群时,需要将在一台机器上配置好的安装包拷贝到集群内的所有机器上。需要在集群中选定一台机器充当NameNode以及 JobTracker,当集群内节点数目比较多的时候,这两者可以部署在两台机器上,它们是主从架构中的master。集群中其他的节点作为 DataNode和TaskTracker,它们是主从架构中的slave。为了使Hadoop集群在运行时可以找到正确的JDK路径,需要在安装目录 conf下的配置文件hadoop-env.sh中配置JDK的路径。配置文件core-site.xml中存放了Hadoop集群的元数据以及临时数据的存放路径,需要配置fs.default.name及两个Hadoop.tmp.dir参数;hadoop.tmp.dir参数配置的目录存放了 HDFS文件系统中文件的存放位置,${hadoop.tmp.dir}/dfs/name目录存放namenode的名字空间,${hadoop.tmp.dir}/dfs/data目录存放了各个datanode节点的数据块。fs.default.name配置 namenode所在的主机和端口号,具体的配置如下所示:

  fs.default.name

  hdfs://localhost:9000

  hadoop.tmp.dir

  /tmp/hadoop-root

  配置好core-site.xml后,还需要指定数据块的副本个数,这是通过修改hdfs-site.xml实现的,将配置参数 dfs.replication的值设置为副本个数,默认值为3。为了使MapReduce任务能够正确运行,还需要配置JobTracker的相关信息,这需要修改mapred-site.xml文件:

  mapred.job.tracker

  http://localhost:9001

  Hadoop集群中的各个节点需要知道哪个节点是master节点,哪些节点是slave节点,这需要配置masters和slaves两个配置文件,masters指明主节点,slaves中配置所有的从节点。

  所有的配置文件修改好之后,将整个Hadoop的安装目录全部拷贝到Hadoop集群内所有其他节点上,这样就完成了Hadoop集群的初步配置。此时在主节点的命令行上输入Hadoop命令后,会出现Hadoop命令的帮助信息,说明Hadoop集群已经安装成功。在使用Hadoop集群前,需要先启动HDFS文件系统和Map/Reduce集群。格式化文件系统的命令为Hadoop namenode



月期刊平台服务过的文章录用时间为1-3个月,依据20年经验,经月期刊专家预审通过后的文章,投稿通过率100%以上!
  • 985和211副教授评职称认可的刊物推荐

    2024-11-28
    985和211院校的副教授评职称,对于个人学术声誉和职业发展是非常重要的,一般副教授发表期刊论文认可的刊物具有较高的学术水平和影响力。以下是对 985和211副教授评职称认可的刊物推荐 ,供大家参考: 1、SCI期刊 SCI期刊,即科学引文索引期刊,是国际学术界公认的权威
  • Sustainability期刊版面费多少

    2024-11-28
    《Sustainability》是一本由MDPI出版社出版的国际性、跨学科的开放获取学术期刊,专注于环境、文化、经济和社会可持续性的研究。那么, Sustainability期刊版面费多少 ? 从1900瑞士法郎上涨至2400瑞士法郎(约19266元人民币),适用于同行评审后接受的论文,该费用于
  • EI期刊论文查重的要求是什么

    2024-11-28
    能够在EI期刊论文发表论文,除了要有高质量的研究成果外,还要通过严格的查重审核。那么, EI期刊论文查重的要求是什么 ?详情如下: EI期刊作为国际学术期刊,对论文的原创性要求较高。查重作为确保论文原创性的手段,可有效避免学术不端行为发生,维护学术界的公平和
  • 评职称,国内高校认可scopus期刊吗?scopus期刊列表

    2024-11-28
    评职称,国内高校认可scopus期刊吗 ? 不同国内高校对scopus期刊评职称认可度可能存在一定的差异性。一些高校和科研机构确实认可scopus收录的期刊,尤其是研究生、博士生和教师晋升职称等方面,但也有一些高校是不认可的,因此在选择发表scopus期刊之前,一定要了解清
  • 解答SCI论文被语言拒稿的技巧

    2024-11-28
    对于国内作者来说,其中一大原因是语言表达,如sci论文出现大量的语法错误、中式英语表达,造成编辑或审稿人对文章内容的理解偏差,导致sci论文被拒稿。以下是 解答SCI论文被语言拒绝的技巧 ,希望能够帮助到你快速发表sci论文。 1、对sci论文专业润色和翻译 为了确保S
  • 中科院院士:94%中国科研SCI论文发表国外期刊,仅5.88%在国内期刊发表

    2024-11-18
    在2024上海科技与期刊高质量发展大会上,中国科学院院士、上海市科协主席张杰指出:2023年,我国科研人员共发表SCI(科学引文索引)论文73.96万篇,其中只有4.35万篇发表在国内期刊,占比5.88%,其余94.12%的论文都发表在国外期刊上。。 开幕式上,上海市科技期刊学会
  • 励志!安徽“扭扭车少年”在《Applied Intelligence》期刊上发表论文

    2024-11-15
    2024年11月, 张亮在国际人工智能领域高水平期刊《Applied Intelligence》(应用智能)上发表题为《Robot Motion Planning Algorithm Based on Deep Learning Optimization》(基于深度学习优化机器人运动规划的算法研究)的论文。 11月19日,张亮创办的公司首款外骨骼
  • 恭喜!《中国财政》入选长安街读书会学习核心来源期刊

    2024-11-14
    《中国财政》确实被正式选为长安街读书会干部学习的核心来源期刊之一。在2024年10月8日发布的《长安街读书会干部学习核心期刊目录》中,《中国财政》被列为核心期刊之一,其关注点在于中华民族现代文明。因此,可以确认《中国财政》正式入选长安街读书会干部学习核心来
  • 恭喜!上海科技期刊三本齐发,影响因子登顶学科王座

    2024-11-13
    据SCI数据库,2023年世界科技论文总数达248万篇,其中收录中国科技论文74万篇,数量居全球之首,占比30%;排名第二的美国,收录论文53万篇,占比21%。 目前,上海共有科技期刊358本,其中英文期刊82本,占比约20%,是全国平均的两倍;SCI期刊54本,其中Q1区期刊35本。
  • 西安交大:主办期刊《药物分析学报(英文)》入选百强榜单,总排名第七

    2024-11-12
    《2024中国英文科技期刊海外媒体传播影响力报告》的发布,彰显了中国科技期刊在国际舞台上的影响力。西安交通大学主办的《药物分析学报(英文)》(Journal of Pharmaceutical Analysis, JPA)在该报告中取得了显著成就,不仅成功进入百强榜单,而且取得了总排名第七的
回到顶部