goback
月期刊咨询网
当前位置:首页>>电子技术论文>>正文

一种QL脚本的解析模块的分析研究


所属栏目:电子技术论文
发布时间:2014-08-19 14:36:12  更新时间:2014-08-19 14:59:11

已签订领域:化学工程/制药,医学题目:**作为抗癌剂***催化剂**取代苯丙***SCI四区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:用**电***生物传感器**癌症**SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:**氧化石墨烯纳米***材料的生物传感器***结肠癌生物**癌胚****SCI二区 直击了解更多选题

已签订领域:环境科学-公共卫生题目:聚合物纳米***a-硫辛酸***在神经炎症***应用***临床分析SCI二区 直击了解更多选题

已签订领域:计算机视觉/遥感/智能驾驶/汽车题目:**深度学习***高分辨率遥感***车辆检***SCI三区 直击了解更多选题

已签订领域:企业管理题目:社会交流***领导***倾向***方向SSCI,SCI三区,二区 直击了解更多选题

已签订领域:企业管理题目:**中小企业社交媒体****可持续绩效***因素探析SSCI,SCI三区,二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:利用硫氨酸***石墨烯纳米***电化学***传感器实现癌胚抗原***SCI二区 直击了解更多选题

已签订领域:环境科学,公共卫生题目:基于抗***纳米复合***高性能***早起癌症诊断***SCI二区 直击了解更多选题

已签订领域:经济,能源题目:***政治冲突****绿色金融、金融**、气***化***SCI四区 直击了解更多选题

已签订领域:经济,能源题目:冲***中能源不安全对***和环境***SCI四区 直击了解更多选题

已签订领域:教育题目:大学生***社交媒体***成绩影响***SSCI三区 直击了解更多选题

已签订领域:教育题目:巴基斯坦***学习实施的***的**SSCI二区 直击了解更多选题

已签订领域:教育题目:大学生对****下网络教学**思***SSCI二区 直击了解更多选题

已签订领域:教育题目:**教师和学生对影响***医疗**效果的****看法SSCI三区 直击了解更多选题

已签订领域:计量经济学题目:**货币、黄金、**和美国***的波动***相互依赖性:**数据的分析SSCI一区 直击了解更多选题

已签订领域:计量经济学题目:东南亚***内**趋同***中等收入**:新**的***SSCI二区 直击了解更多选题

已签订领域:建筑,历史题目:历史景点在***旅游发***中的***影响**(**研究:**历史***)SSCI,SCI一区 直击了解更多选题

已签订领域:领导力,管理题目:量化**领导对角色绩效***响:**冲突与工作自主性***作用SCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:数字***环境对学生学习成绩***:游戏**和***现实在教育***作用SSCI四区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***续决策之间的***:创新***识的**作用SSCI二区 直击了解更多选题

已签订领域:信息技术,教育题目:课程**对大学生***发展的影响:学习习惯和***的***作用SSCI一区 直击了解更多选题

已签订领域:信息技术,教育题目:信息技术***与可持续决策**:高等***学生认知***作用SSCI二区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语****学**与人工智能****学习SCI三区 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐**对学生成绩***的影响SCI三区 直击了解更多选题

已签订领域:人体工程,心理学题目:基于预先处理模型***模式人体工程学***女生肌肉骨骼***预防行为*** 直击了解更多选题

已签订领域:人体工程,心理学题目:制定一个***人体工程学**,以识别、优先考虑***职业压力源的*** 直击了解更多选题

已签订领域:人体工程,心理学题目:多重工作**压力和工作***:***工效学方法的混合方法*** 直击了解更多选题

已签订领域:数学,经济题目:数学模型***结构调整和经济转型****研究 直击了解更多选题

已签订领域:数学,经济题目:***时间**数学模型在***媒体营销**中的应用*** 直击了解更多选题

已签订领域:数学,经济题目:***时间**模型在***物流运**能力***研究 直击了解更多选题

已签订领域:数学,经济题目:碳****经济的数学模型****研究 直击了解更多选题

已签订领域:农村经济题目:农****社区**发展***分**SCI四区 直击了解更多选题

已签订领域:农村经济题目:创业***对乡村****发展的****SCI四区 直击了解更多选题

已签订领域:农村经济题目:农村创业****的空间*****究SCI四区 直击了解更多选题

已签订领域:医学,电化学题目:纳米颗粒*****及其在癌症****和重金属*****检测中的应用SCI三区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****前列腺癌药物氟****检测方法的*****腺癌治疗SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:气海***********金纳米颗粒的新型****************粘土及其对胃癌********************抗癌SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于抗***********GCE纳米***********材料的高性能*******************早期癌症SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:用******电化学生物传感器*****癌症***************SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:基于*****石墨烯纳米****材料的生物传感******用于测定结肠*****生物*****SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:聚合***纳米复合电极*****疏辛酸电化学检测*********SCI二区 直击了解更多选题

已签订领域:医学,电化学题目:利用****酸/**糖**石墨烯纳米复合修饰的电化学*****SCI二区 直击了解更多选题

已签订领域:环境能源,绿色投资题目:环境能源、绿色投资、城市化和环境类方向SCI三区 直击了解更多选题

已签订领域:计算机,英语教学题目:英语教学**人工智能***习SCI 直击了解更多选题

已签订领域:计算机,音乐题目:评价**和音乐形式*学生***影响SCI三区 直击了解更多选题

已签订领域:经济,绿色投资题目:***能源效率***化之间的***SCI三区 直击了解更多选题

已签订领域:经济政策题目:***阐明**印度经济***的关系SCI三区 直击了解更多选题

已签订领域:经济,金融题目:***国家的能源***重***SCI 直击了解更多选题

已签订领域:经济,金融投资题目:***融新之间***直接投资***SCI三区 直击了解更多选题

已签订领域:经济,数学,统计学,管理学题目:非***想重限制下***袭评价***SSCI四区 直击了解更多选题

已签订领域:经济,数字,管理学题目:基干***生产系统***SSCI四区 直击了解更多选题

已签订领域:农业,土壤科学题目:不同***有机覆盖***养分循环SSCI 直击了解更多选题

已签订领域:电力与能源系统,管理题目:pv***氢定价的***随***型稀SSCI,SCI二区 直击了解更多选题

已签订领域:建筑规划,计算机题目:使用***因子分析法***可持续***SCI三区 直击了解更多选题

已签订领域:工程技术,纺织工程,材料科学题目:甘***淀粉酶的提取***退浆中的应用SCI四区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:饲料***镉毒性的交互***生长***病理学***SCI二区 直击了解更多选题

已签订领域:渔业,鱼类生理学题目:****鱼水源***起的生******SCI三区 直击了解更多选题

已签订领域:金融,环境经济题目:*****预算在能效、绿色***的作用SCI 直击了解更多选题

已签订领域:应用数学/计算物理题目:***非线性库***自相位调制***SCI三区 直击了解更多选题

已签订领域:计算机,医学检测题目:***COVID-19***力***算法***决策SCI三区 直击了解更多选题

已签订领域:计算机,物联网,智慧城市题目:基于***物联网****算法SCI三区 直击了解更多选题

  QL脚本在设计方面,充分考虑了与现有数据库查询语言SQL相结合的特点,QL脚本无疑可以被看作是对数据库查询语句SQL的一种转型和衍生。

  摘要:作为MapReduce系统的核心组件的脚本解析模块,它是分布式云计算平台实现的基础。该模块的实现是基于脚本编程接口,在此过程中使用的语言是QL(Query Language)。QL脚本通过脚本解析模块实现解析之后,事件执行模块则由参数通过配置事件的方式一一实现。下面就这种脚本语言的实现过程作了详细的分析。

  关键词:核心期刊征稿,MapReduce,脚本解析,QL,事件配置

  An Analysis of Parsing Module QL Script

  CHEN Hao

  (Guangdong Technical College of Water Resources and Electric Engineering, Computer Information Engineering, Guangzhou 510925, China)

  Abstract:MapReduce system as a core component of the script parsing module, which is the basis for a distributed cloud computing platform implementation. The module is based on the realization scripting interface, the language used in this process is QL (Query Language). After the QL script by script parsing module for parsing, event execution module configured by the parameters of events come true. The following detailed analysis of the implementation process of this scripting language.

  Key words:MapReduce; script parsing; QL; event configuration

  1 QL脚本的设计理念

  基于对现有技术的可扩展性和覆盖性分析,使用QL脚本来定义关键词的过程能够适应市场上各种网络流量统计的不同类型,当然必须对设计过程中对关键词的灵活扩展性作以充分性的考虑,以便于后期对QL脚本的扩容升级,更好的支撑云计算平台的综合应用。

  2 QL脚本模块的分析

  QL脚本模块解析可以分为以下几大模块:解析引擎(ScritEngine)、脚本语句解释器(ScritParser)、比较运算模块(Compare)、算术运算模块(Arithmetic)、逻辑运算模块(ExpressionEngine)、聚合运算模块(Aggregate)、字段运算模块(Field)、配置模块(Configuration)等。图1是QL脚本解析模块的整体结构图。

  QL脚本解析的实现过程如下:系统的入口为 ScriptEngine,它的功能是读取QL语言脚本,并将脚本逐行传递给脚本解析器。脚本解析器按照每行的QL语言脚本首字母对语句进行分类,根据不同语句的类别调用不同的解释模块对语句进行解析。语句解析逐行进行,如脚本中含有子句等其他复杂句型,脚本解析器会调用其他的处理模块,如调用聚合运算模块对脚本进行相应的处理。

  3 配置文件的定义及解析过程

  一个完整的QL语言脚本包括配置文件、原始数据文件、输出结果保存位置和统计执行语句。模块在运行时,首先需要对配置文件进行解析以获取数据格式,然后对输入数据和输出数据路径进行解析,最后解析统计执行语句,并将解析的命令传递给作业执行模块。

  编写QL语言脚本时,首先应指定配置文件,指明要处理的数据格式。配置文件的格式如下:列序号、名称、描述、数据类型。根据配置文件中的格式,系统对输入数据进行匹配,从而对指定列序号的数据进行操作。配置文件支持如下的关键词:

  表1 配置文件关键词列表[关键字\&功能\&ResetColumn语句\&用于重新载入列配置文件,切换不同的配置文件\&createColumn语句\&用于创建一个新的配置文件,并载入这个配置文件\&AddColumn语句\& 对当前的配置文件进行增加列的操作\&]

  如上表所示,目前配置文件中共支持三个关键词,分别为:ResetColumn用于重新载入列配置文件,可用于切换不同的配置文件。CreateColumn用于在当前脚本中创建一个新的配置文件。AddColumn对当前的配置文件进行增加列的操作。

  4 关键词解析

  QL语言中的关键词指的是在每一句QL脚本句首的单词,每个语句的功能由此关键词来确定,在解析时脚本解析模块会根据该关键词来进行下一步的判断。目前QL语言支持的关键词为:Process,Select,Count,CountD如下表所示。

  表2 脚本关键词列表

  [分类\&关键字\&功能简介\&分组聚合统计\&Process\&对各分组求集合函数值\&选择字段\&Select\&选择字段、字串、表达式输出结果\&多重计算\&Count\&同时对多个逻辑表达式计数\&去重计算\&Countd\&对指定字段去重计算\&]

  1) Process 语句   功能介绍:提供统计各分组内的聚合函数运算结果的功能。Process语句支持多种表达式,表达式中必须包含有函数。且支持多种子句:where 子句、groijpby 子句、order by 子句、tofile 子句,having 子句' limit 子句。

  在脚本解析时,Process类接收以"Process"开头的一行脚本,从后往前寻找各个子句,并将该行脚本切割为各个子句,创建子句解释类的对象处理各个子句。 Process语句脚本解析过程按照从后往前的顺序解析子句。解析完成后,将所需信息封装起来,通过作业配置的方法,传给作业执行模块。

  2) Select 语句

  功能介绍:用于选择某列或多列输出。提供选择某个字段、多个字段四则运算或字段运算的功能。

  Select语句类关系与Process的类似,按照从后往前的顺序解析子句。Select语句支持多重输出功能,语句中可通过花括号指定多重输出条件和输出文件名。解析完成后,将所需信息封装起来,通过作业配置的方式,传入作业执行模块。

  3) Count 语句

  功能介绍:提供同时计数多个值的功能。

  Count语句设计为同时计数多个值的功能。Count后可跟多个逻辑表达式,在一次读取数据的同时,计数满足各个表达式条件的记录数。

  4) CountD 语句

  功能介绍:提供对指定字段的去重计数功能。

  CountD语句支持where子句,group by子句和tofile子句。CoimtD语句的主要功能是以符合where指定条件的话单为对象,按照groipby分组,对CountD指定的字段进行去重计数。

  以上的QL关键词只是定义了该语句的功能范围,实际统计的任务需要其他运算逻辑语句来组成更为复杂的操作。全部的关键词都支持算术运算,包含加减乘除四种运算,并且可以使用括号定义运算优先级。当没有括号时,将从左到右进行计算,乘除运算优先于加减运算。

  5 事件执行模块

  事件执行模块的功能是接收脚本解析模块传递过来的参数,根据参数选择不同的Map和Reduce类,并配置和提交统计事件到Hadoop框架。事件执行模块内的各模块基本都遵循Hadoop的Map Reduce框架的接口定义。主要任含以下几个模块:输入输出模块、Map模块、Partition模块、Combine模块和Reduce模块。

  事件执行过程示意图如下:

  图2 事件执行过程示意图

  每一行语句可解释为一个可执行的MapReduce的事件,事件执行组件配置好事件后提交给Hadoop的JobTracker,由Hadoop的 Map Reduce框架执行事件,Map模块读取原始数据分块,Partition模块和Combine模块对Map模块输出的统计结果进行合并处理,最后提交给Reduce模块最终输出至HDFS。

  1) 输入输出模块

  输入模块负责读入文件分片并将其分割成记录,适用于读取流记录这种半结构化文件。本模块的输入为网络流量记录文件,输出为统计任务的键/值对,主键为本条记录在文件中的字节偏移量,值为流量记录值。本模块只用于读取半结构化的文本文件,输入模块输出的键/值对,通过引用传递给Map模块。

  输出模块根据指定的字段分隔符和行分隔符输出结果。本模块与输入模块类似,可以将记录以行的形式存入文本文件中。其输入为Reduce模块产生的键/值对。输出为最终结果文件,存储在HDFS上。

  2) Map 模块

  Map模块的功能为从整条网络流量记录中取出指定字段,经过提取、计算等操作后,产生键/值对,并将统计的初步结果写到计算机本地磁盘。Map模块继承了 Hadoop框架的Map模块,并根据处理的网络流量记录格式进行了一些定制。

  根据统计功能的不同,目前系统包含如下两个Map部件:GrovpMapper和CountMapper。GroipMapper用于处理分组后的集合统计,分组条件作为主键,Map端集合运算结果作为值进行输出。CountMapper用于处理多重计数的统计需求。Map模块的输入为输入模块输出的键 /值对,Map模块对相同的主键的键值进行合并处理后,输出新的键/值对,键为分组的条件,值为该分组对应的值。

  3) 数据分割模块(Partition)

  Partition模块继承了 Hadoop框架定义的Partition模块。利用该模块,系统将Map输出的结果进行初步划分,可以保证某一取值范围的中间结果送到同一个 Reduce任务中进行处理。划分时采用对key进行hash运算的方式,在保证正确性的同时一定程度上简化Reduce的过程。划分的个数是由用户自定义的Reduce任务的个数。

  4) 数据合并模块(Combine)

  Combine模块用于计算机本地中间文件的合并。该模块通常运行在Reduce操作前,对之前模块的结果中相同主键的键/值对进行合并。Combine模块的处理步骤与Reduce的操作是相似的,但是 Combine模块通常在Map模块运行后进行,它的出现可以有效的减少集群内的数据传输。因为在Map Reduce运行的过程中,Map模块和Reduce不一定在同一运算节点进行,该模块可以将Map输出的结果进行初步合并,减少输入至Reduce模块的文件大小。

  5) Reduce 模块

  Reduce模块继承了 Hadoop框架定义的Reduce模块,实现的功能是对前一模块统计的中间结果进行合并,输出最终结果。处理流程为:Map模块的中间结果被 Combine模块和Partition模块处理以后,存入运算节点的本地磁盘临时文件内。集群主节点通知Reduce模块去对应的运算节点读取文件。目前系统所有Map模块生成的中间结果都按主键值被Hash函数分成N份(N是系统用户指定的Reduce数量),N个Reduce任务分别负责不同的主键取值区间。因此,所有的Reduce任务需要按照主键的取值范围去对应的节点读取Map输出的中间结果,并将其形成键/值的列表。读取后,再次按照主键进行合并,并进行函数计算、算术运算、逻辑运算等操作。最终由输出模块将最终的键/值对输出到HDFS。

  5 结束语

  QL语言设计目的是能让了解该语言的普通用户,即使在完全不懂JAVA编程技能的情况下,能够在云计算平台系统上进行分

  布式计算。因为作为开源项目的Hadoop为用户提供了众多的JAVA编程接口,但是很多用户并不具备编写完整程序的能力,而且针对不同的分析任务都编写相应的程序成本较高。通过QL语言可以较好的解决这一难题,用户只要在掌握基本的语法的情况下即可实现分布式的云计算。

  参考文献:

  [1] 万至臻.基于MapReduce模型的并行计算平台的设计与实现[D].杭州:浙江大学,2008.

  [2] 谢桂兰.基于Hadoop MapReduce模型的应用研究[J].微型机与应用,2010,4.

  [3] 陈香香.云计算中MapReduce性能优化及应用[D]. 重庆:重庆大学,2011.



  • 985和211副教授评职称认可的刊物推荐

    2024-11-28
    985和211院校的副教授评职称,对于个人学术声誉和职业发展是非常重要的,一般副教授发表期刊论文认可的刊物具有较高的学术水平和影响力。以下是对 985和211副教授评职称认可的刊物推荐 ,供大家参考: 1、SCI期刊 SCI期刊,即科学引文索引期刊,是国际学术界公认的权威
  • Sustainability期刊版面费多少

    2024-11-28
    《Sustainability》是一本由MDPI出版社出版的国际性、跨学科的开放获取学术期刊,专注于环境、文化、经济和社会可持续性的研究。那么, Sustainability期刊版面费多少 ? 从1900瑞士法郎上涨至2400瑞士法郎(约19266元人民币),适用于同行评审后接受的论文,该费用于
  • EI期刊论文查重的要求是什么

    2024-11-28
    能够在EI期刊论文发表论文,除了要有高质量的研究成果外,还要通过严格的查重审核。那么, EI期刊论文查重的要求是什么 ?详情如下: EI期刊作为国际学术期刊,对论文的原创性要求较高。查重作为确保论文原创性的手段,可有效避免学术不端行为发生,维护学术界的公平和
  • 评职称,国内高校认可scopus期刊吗?scopus期刊列表

    2024-11-28
    评职称,国内高校认可scopus期刊吗 ? 不同国内高校对scopus期刊评职称认可度可能存在一定的差异性。一些高校和科研机构确实认可scopus收录的期刊,尤其是研究生、博士生和教师晋升职称等方面,但也有一些高校是不认可的,因此在选择发表scopus期刊之前,一定要了解清
  • 解答SCI论文被语言拒稿的技巧

    2024-11-28
    对于国内作者来说,其中一大原因是语言表达,如sci论文出现大量的语法错误、中式英语表达,造成编辑或审稿人对文章内容的理解偏差,导致sci论文被拒稿。以下是 解答SCI论文被语言拒绝的技巧 ,希望能够帮助到你快速发表sci论文。 1、对sci论文专业润色和翻译 为了确保S
  • 中科院院士:94%中国科研SCI论文发表国外期刊,仅5.88%在国内期刊发表

    2024-11-18
    在2024上海科技与期刊高质量发展大会上,中国科学院院士、上海市科协主席张杰指出:2023年,我国科研人员共发表SCI(科学引文索引)论文73.96万篇,其中只有4.35万篇发表在国内期刊,占比5.88%,其余94.12%的论文都发表在国外期刊上。。 开幕式上,上海市科技期刊学会
  • 励志!安徽“扭扭车少年”在《Applied Intelligence》期刊上发表论文

    2024-11-15
    2024年11月, 张亮在国际人工智能领域高水平期刊《Applied Intelligence》(应用智能)上发表题为《Robot Motion Planning Algorithm Based on Deep Learning Optimization》(基于深度学习优化机器人运动规划的算法研究)的论文。 11月19日,张亮创办的公司首款外骨骼
  • 恭喜!《中国财政》入选长安街读书会学习核心来源期刊

    2024-11-14
    《中国财政》确实被正式选为长安街读书会干部学习的核心来源期刊之一。在2024年10月8日发布的《长安街读书会干部学习核心期刊目录》中,《中国财政》被列为核心期刊之一,其关注点在于中华民族现代文明。因此,可以确认《中国财政》正式入选长安街读书会干部学习核心来
  • 恭喜!上海科技期刊三本齐发,影响因子登顶学科王座

    2024-11-13
    据SCI数据库,2023年世界科技论文总数达248万篇,其中收录中国科技论文74万篇,数量居全球之首,占比30%;排名第二的美国,收录论文53万篇,占比21%。 目前,上海共有科技期刊358本,其中英文期刊82本,占比约20%,是全国平均的两倍;SCI期刊54本,其中Q1区期刊35本。
  • 西安交大:主办期刊《药物分析学报(英文)》入选百强榜单,总排名第七

    2024-11-12
    《2024中国英文科技期刊海外媒体传播影响力报告》的发布,彰显了中国科技期刊在国际舞台上的影响力。西安交通大学主办的《药物分析学报(英文)》(Journal of Pharmaceutical Analysis, JPA)在该报告中取得了显著成就,不仅成功进入百强榜单,而且取得了总排名第七的
回到顶部