网上有关“核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研究的简介)”话题很是火热,小编也是针对核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研究的简介)寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
生物信息学(Bioinformatics)
是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
生物信息学是一门利用计算机技术研究生物系统之规律的学科。
目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?
生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W. Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。
生物信息学的主要研究方向: 基因组学 - 蛋白质组学 - 系统生物学 - 比较基因组学
姑且不去引用生物信息学冗长的定义,以通俗的语言阐述其核心应用即是:随着包括人类基因组计划在内的生物基因组测序工程的里程碑式的进展,由此产生的包括生物体生老病死的生物数据以前所未有的速度递增,目前已达到每14个月翻一番的速度。同时随着互联网的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。然而这些仅仅是原始生物信息的获取,是生物信息学产业发展的初组阶段,这一阶段的生物信息学企业大都以出售生物数据库为生。以人类基因组测序而闻名的塞莱拉公司即是这一阶段的成功代表。
原始的生物信息资源挖掘出来后,生命科学工作者面临着严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学产业的高级阶段体现于此,人类从此进入了以生物信息学为中心的后基因组时代。结合生物信息学的新药创新工程即是这一阶段的典型应用。
[编辑本段]发展简介
生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解.研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在,1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色.1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等.与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构.1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋).DNA以磷酸糖链形成发双股螺旋,脱氧核糖上的碱基按Chargaff规律构成双股磷酸糖链之间的碱基对.这个模型表明DNA具有自身互补的结构,根据碱基对原则,DNA中贮存的遗传信息可以精确地进行复制.他们的理论奠定了分子生物学的基础.DNA双螺旋模型已经预示出了DNA复制的规则,Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA.DNA的复制需要一个DNA作为模板.Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制.Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用.经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译.限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础.正是由于分子生物学的研究对生命科学的发展有巨大的推动作用,生物信息学的出现也就成了一种必然.2001年2月,人类基因组工程测序的完成,使生物信息学走向了一个高潮.由于DNA自动测序技术的快速发展,DNA数据库中的核酸序列公共数据量以每天106bp速度增长,生物信息迅速地膨胀成数据的海洋.毫无疑问,我们正从一个积累数据向解释数据的时代转变,数据量的巨大积累往往蕴含着潜在突破性发现的可能,"生物信息学"正是从这一前提产生的交叉学科.粗略地说,该领域的核心内容是研究如何通过对DNA序列的统计计算分析,更加深入地理解DNA序列,结构,演化及其与生物功能之间的关系,其研究课题涉及到分子生物学,分子演化及结构生物学,统计学及计算机科学等许多领域.生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取,处理,存储,分配和解释.基因组信息学的关键是"读懂"基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计.了解基因表达的调控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病的诊断,治疗内在规律.它的研究目标是揭示"基因组信息结构的复杂性及遗传语言的根本规律",解释生命的遗传语言.生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿.
[编辑本段]主要研究方向
生物信息学在短短十几年间,已经形成了多个研究方向,以下简要介绍一些主要的研究重点.
1,序列比对(Sequence Alignment)
序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似性.从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列.在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列比较两个或多个序列的相似性在数据库中搜索相关序列和子序列寻找核苷酸(nucleotides)的连续产生模式找出蛋白质和DNA序列中的信息成分序列比对考虑了DNA序列的生物学特性,如序列局部发生的插入,删除(前两种简称为indel)和替代,序列的目标函数获得序列之间突变集最小距离加权和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等.两个序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,甚至采用算法复杂性为线性的也难以奏效.因此,启发式方法的引入势在必然,著名的BALST和FASTA算法及相应的改进方法均是从此前提出发的.
2, 蛋白质结构比对和预测
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性.蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般相似.蛋白质是由氨基酸组成的长链,长度从50到1000~3000AA(Amino Acids),蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等.氨基酸的序列内在的决定了蛋白质的3维结构.一般认为,蛋白质有四级不同的结构.研究蛋白质结构和预测的理由是:医药上可以理解生物的功能,寻找dockingdrugs的目标,农业上获得更好的农作物的基因工程,工业上有利用酶的合成.直接对蛋白质结构进行比对的原因是由于蛋白质的3维结构比其一级结构在进化中更稳定的保留,同时也包含了较AA序列更多的信息.蛋白质3维结构研究的前提假设是内在的氨基酸序列与3维结构一一对应(不一定全真),物理上可用最小能量来解释.从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构.同源建模(homology modeling)和指认(Threading)方法属于这一范畴.同源建模用于寻找具有高度相似性的蛋白质结构(超过30%氨基酸相同),后者则用于比较进化族中不同的蛋白质结构.然而,蛋白结构预测研究现状还远远不能满足实际需要.
3, 基因识别,非编码区分析研究.
基因识别的基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.非编码区由内含子组成(introns),一般在形成蛋白质后被丢弃,但从实验中,如果去除非编码区,又不能完成基因的复制.显然,DNA序列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中.分析非编码区DNA序列目前没有一般性的指导方法.在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已完成编码部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序列是难以想象的.侦测密码区的方法包括测量密码区密码子(codon)的频率,一阶和二阶马尔可夫链,ORF(Open Reading Frames),启动子(promoter)识别,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子进化和比较基因组学
分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树.既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似性.通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的.早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化的依据.近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化.在匹配不同种族的基因时,一般须处理三种情况:Orthologous: 不同种族,相同功能的基因;Paralogous: 相同种族,不同功能的基因;Xenologs: 有机体间采用其他方式传递的基因,如被病毒注入的基因.这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现.
5, 序列重叠群(Contigs)装配
根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,如人类基因的测量就采用了短枪(shortgun)方法,这就要求把大量的较短的序列全体构成了重叠群(Contigs).逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配.从算法层次来看,序列的重叠群是一个NP-完全问题.
6, 遗传密码的起源
通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今.不同于这种"冻结"理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密码.随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材.
7, 基于结构的药物设计
人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗.基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域.为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物.这一领域目的是发现新的基因药物,有着巨大的经济效益.
8.生物系统的建模和仿真
随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟(Curr Opin Rheumatol,2007,463-70),系统稳定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系统鲁棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)为代表的建模语言在迅速发展之中,以布尔网络 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、随机过程(Neural Comput,2007,3262-92)、离散动态事件系统等(Bioinformatics,2007,336-43)方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题(Anal Quant Cytol Histol,2007,296-308)。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨 识所需要的数据远远超过了目前数据的产出能力。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系 统建模主要困难。系统描述和建模方法也需要开创性的发展。
9.生物信息学技术方法的研究
生物信息学不仅仅是生物学知识的简单整理和、数学、物理学、信息科学等学科知识的简单应用。海量数据和复杂的背景导致机器学习、统 计数据分析和系统描述等方法需要在生物信息学所面临的背景之中迅速发展。巨大的计算量、复杂的噪声模式、海量的时变数据给传统的统计分析带来了巨大的困难, 需要像非参数统计(BMC Bioinformatics,2007,339)、聚类分析(Qual Life Res,2007,1655-63)等更加灵活的数据分析技术。高维数据的分析需要偏最小二乘(partial least squares,PLS)等特征空间的压缩技术。在计算机算法的开发中,需要充分考虑算法的时间和空间复杂度,使用并行计算、网格计算等技术来拓展算法的 可实现性。
10, 生物图像
没有血缘关系的人,为什么长得那么像呢?
外貌是像点组成的,像点愈重合两人长得愈像,那两个没有血缘关系的人像点为什么重合?
有什么生物学基础?基因是不是相似?我不知道,希望专家解答。
11, 其他
如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域;在学科方面,由生物信息学衍生的学科包括结构基因组学,功能基因组学,比较基因组学,蛋白质学,药物基因组学,中药基因组学,肿瘤基因组学,分子流行病学和环境基因组学.从现在的发展不难看出,基因工程已经进入了后基因组时代.我们也有应对与生物信息学密切相关的如机器学习,和数学中可能存在的误导有一个清楚的认识.
[编辑本段]生物信息学与机器学习
生物信息的大规模给数据挖掘提出了新课题和挑战,需要新的思想的加入.常规的计算机算法仍可以应用于生物数据分析中,但越来越不适用于序列分析问题.究其原因,是由于生物系统本质上的模型复杂性及缺乏在分子层上建立的完备的生命组织理论.西蒙曾给出学习的定义:学习是系统的变化,这种变化可使系统做相同工作时更有效。机器学习的目的是期望能从数据中自动地获得相应的理论,通过采用如推理,模型拟合及从样本中学习,尤其适用于缺乏一般性的理论,"噪声"模式,及大规模数据集.因此,机器学习形成了与常规方法互补的可行的方法.机器学习使得利用计算机从海量的生物信息中提取有用知识,发现知识成为可能.机器学习方法在大样本,多向量的数据分析工作中发挥着日益重要的作用,而目前大量的基因数据库处理需要计算机能自动识别,标注,以避免即耗时又花费巨大的人工处理方法.早期的科学方法—观测和假设----面对高数据的体积,快速的数据获取率和客观分析的要求---已经不能仅依赖于人的感知来处理了.因而,生物信息学与机器学习相结合也就成了必然.机器学习中最基本的理论框架是建立在概率基础上的,从某种意义来说,是统计模型拟合的延续,其目的均为提取有用信息.机器学习与模式识别和统计推理密切相关.学习方法包括数据聚类,神经网络分类器和非线性回归等等.隐马尔可夫模型也广泛用于预测DNA的基因结构.目前研究重心包括:1)观测和探索有趣的现象.目前ML研究的焦点是如何可视化和探索高维向量数据.一般的方法是将其约简至低维空间,如常规的主成分分析(PCA),核主成分分析(KPCA),独立成分分析(Independent component analysis),局部线性嵌套(LocallyLinear embedding).2)生成假设和形式化模型来解释现象[6].大多数聚类方法可看成是拟合向量数据至某种简单分布的混合.在生物信息学中聚类方法已经用于microarray数据分析中,癌症类型分类及其他方向中.机器学习也用于从基因数据库中获得相应的现象解释.机器学习加速了生物信息学的进展,也带了相应的问题.机器学习方法大多假定数据符合某种相对固定的模型,而一般数据结构通常是可变的,在生物信息学中尤其如此,因此,有必要建立一套不依赖于假定数据结构的一般性方法来寻找数据集的内在结构.其次,机器学习方法中常采用"黑箱"操作,如神经网络和隐马尔可夫模型,对于获得特定解的内在机理仍不清楚.
[编辑本段]生物信息学的数学问题
生物信息学中数学占了很大的比重.统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;其他如用于序列比对的运筹学;蛋白质空间结构预测和分子对接研究中采用的最优化理论;研究DNA超螺旋结构的拓扑学;研究遗传密码和DNA序列的对称性方面的群论等等.总之,各种数学理论或多或少在生物学研究中起到了相应的作用.但并非所有的数学方法在引入生物信息学中都能普遍成立的,以下以统计学和度量空间为例来说明.
1, 统计学的悖论
数学的发展是伴随悖论而发展的.对于进化树研究和聚类研究中最显著的悖论莫过于均值了,就说明了要采用常规的均值方法不能将这两类分开,也表明均值并不能带来更多的数据的几何性质.那么,如果数据呈现类似的特有分布时,常有的进化树算法和聚类算法(如K-均值)往往会得错误的结论.统计上存在的陷阱往往是由于
对数据的结构缺乏一般性认识而产生的.
2, 度量空间的假设
在生物信息学中,进化树的确立,基因的聚类等都需要引入度量的概念.举例来说,距离上相近或具有相似性的基因等具有相同的功能,在进化树中满足分值最小的具有相同的父系,这一度量空间的前提假设是度量在全局意义下成立.那么,是否这种前提假设具有普适性呢,我们不妨给出一般的描述:假定两个向量为A,B,其中,,则在假定且满足维数间线性无关的前提下,两个向量的度量可定义为:(1)依据上式可以得到满足正交不变运动群的欧氏度量空间,这也是大多数生物信息学中常采用的一般性描述,即假定了变量间线性无关.然而,这种假设一般不能正确描述度量的性质,尤其在高维数据集时,不考虑数据变量间的非线性相关性显然存在问题,由此,我们可以认为,一个正确的度量公式可由下式给出:(2)上式中采用了爱因斯坦和式约定,描述了变量间的度量关系.后者在满足(3)时等价于(1),因而是更一般的描述,然而问题在于如何准确描述变量间的非线性相关性,我们正在研究这个问题.
[编辑本段]统计学习理论在生物信息学中应用的困难
生物信息学中面对的数据量和数据库都是规模很大的,而相对的目标函数却一般难以给出明确的定义.生物信息学面临的这种困难,可以描述成问题规模的巨大以及问题定义的病态性之间的矛盾,一般从数学上来看,引入某个正则项来改善性能是必然的[7].以下对基于这一思想产生的统计学习理论,Kolmogorov复杂性[98]和BIC(Bayesian Information Criterion)[109]及其存在的问题给出简要介绍.支持向量机(SVM)是近来较热门的一种方法,其研究背景是Vapnik的统计学习理论,是通过最大化两个数据集的最大间隔来实现分类,对于非线性问题则采用核函数将数据集映射至高维空间而又无需显式描述数据集在高维空间的性质,这一方法较之神经方法的好处在于将神经网络隐层的参数选择简化为对核函数的选择,因此,受到广泛的注意.在生物信息学中也开始受到重视,然而,核函数的选择问题本身是一个相当困难的问题,从这个层次来看,最优核函数的选择可能只是一种理想,SVM也有可能象神经网络一样只是机器学习研究进程中又一个大气泡.Kolmogorov复杂性思想与统计学习理论思想分别从不同的角度描述了学习的性质,前者从编码的角度,后者基于有限样本来获得一致收敛性.Kolmogorov复杂性是不可计算的,因此由此衍生了MDL原则(最小描述长度),其最初只适用于离散数据,最近已经推广至连续数据集中,试图从编码角度获得对模型参数的最小描述.其缺陷在于建模的复杂性过高,导致在大数据集中难以运用.BIC准则从模型复杂性角度来考虑,BIC准则对模型复杂度较高的给予大的惩罚,反之,惩罚则小,隐式地体现了奥卡姆剃刀("Occam Razor")原理,近年也广泛应用于生物信息学中.BIC准则的主要局限是对参数模型的假定和先验的选择的敏感性,在数据量较大时处理较慢.因此,在这一方面仍然有许多探索的空间.
γ测量是利用仪器测量地表岩石或覆盖层中放射性核素放出的γ射线,并根据射线强度或能量的变化,发现γ异常或γ射线强度(或能量)增高地段,以寻找铀矿床或解决其他地质问题的一种天然核辐射测量方法。
γ测量可在地面、空中和井中进行,按测量的物理量的不同,可分为γ总量测量和γ能谱测量两类。γ总量测量简称γ测量,是一种积分γ测量,记录的是铀、钍、钾放出的γ射线的总照射量率,但无法区分它们。γ能谱测量是一种微分γ测量,记录的是特征能谱段的γ射线照射量率,并进而确定岩石中铀、钍、钾的含量,故解决的地质问题更广泛。
12.1.1 地面γ测量
12.1.1.1 γ射线照射量率的计算
γ辐射仪在地表测得的γ射线照射量率与地质体的形态、规模、放射性核素含量、γ射线谱成分、盖层特点及测量条件等因素有关。下面仅对一些简单模型进行讨论,以便了解地质体周围γ射线照射量率分布的基本特征。
(1)点源的γ射线照射量率
设点状γ源处于均匀介质中,则介质内部距离点源R(cm)处的γ射线照射量率为
勘查技术工程学
式中m为点源中放射性物质的质量(g);μ为介质对γ射线的吸收系数(cm-1);K为伽马常数,数值上它等于对γ射线无吸收的情况下,距质量为1 g的点源1 cm处的γ射线的照射量率。铀、镭、钍、钾的K值分别为
勘查技术工程学
用不同类型仪器测量时,K值稍有变化。
当点源产生的γ射线通过几种不同介质时,距点源R处的γ射线照射量率为
勘查技术工程学
式中μi为第i种介质对γ射线的吸收系数(cm-1),Ri为γ射线通过第i种介质的距离(cm)。
(2)圆台状岩体上的γ射线照射量率
如图12-1所示,有一高为 l、上底半径为 R 的圆台状岩体出露地表,其密度为ρ,放射性核素质量分数为 w,岩石对γ射线的自吸收系数为μ,空气对γ射线的吸收系数为μ0,则圆台体内放射性物质质量为 dm 的体积元 dV 在高度为H 的P 点处产生的γ射线照射量率为
图12-1 圆台状岩体上γ射线照射量率的计算参数
勘查技术工程学
取P为球坐标的原点,将dm=wρdV,dV=r2sinφdrdφdθ代入上式,并对整个体积积分,则
勘查技术工程学
由于r1-r0=lsecφ,r0=Hsecφ,故上式变为
勘查技术工程学
对(12.1-4)式中的积分,可引入金格函数
勘查技术工程学
式中t=xsecφ。金格函数是比指数函数e-x衰减得更快的列表函数(见表12-1)。当x→0时,Φ(x)→1;x→∞时,Φ(x)→0。可以证明
表12-1 金格函数表
勘查技术工程学
将(12.1-5)式代入(12.1-4)式(x=μ0H或x=μl+μ0H),则圆台体在空中任一点P产生的γ射线照射量率为
勘查技术工程学
式中φ0为P点对圆台上底半径的张角,且有
勘查技术工程学
如果圆台厚度为无限大(l→∞),则(12.1-6)式变为
勘查技术工程学
地面测量中,仪器探头紧贴地面移动,可认为H→0,则上式简化为
勘查技术工程学
容易证明,观测点P对圆台所张的立体角为
勘查技术工程学
于是,(12.1-8)式可写成
勘查技术工程学
(12.1-9)式表明,对于放射性核素含量均匀的同一放射岩层,观测点对岩体所张的立体角不同,会对地面γ测量结果产生很大的影响。如图12-2所示,在狭缝中测得的γ射线照射量率高于平坦表面的照射量率,而在微地形凸出部分的顶部测到的γ射线照射量率就更低。所以,地面γ测量中应注意微地形对测量结果的影响,一般应记录平坦表面上的测量数据。
图12-2 不同立体角对γ测量的影响
(3)半无限岩层上的γ射线照射量率
对于体积半无限大的岩层,l→∞,R→∞,φ0→π/2。因此(12.1-6)式中cosφ0→0,Φ(μl+μ0H)→0,此时离地面H高度上P点的γ射线照射量率为
勘查技术工程学
可见P点的γ射线照射量率将随高度的增加按金格函数规律衰减。
地面测量中,在岩层表面任一点,H→0,Φ(μ0H)→1,此时γ射线照射量率达到极大值
勘查技术工程学
(4)半无限大岩层上有覆盖层时的γ射线照射量率
设非放射性覆盖层厚度为h,覆盖层对γ射线的吸收系数为μ1,则用与推导(12.1-10)式类似的方法,可求得覆盖层表面上任一点的γ射线照射量率
勘查技术工程学
上式表明,无限大岩体覆盖层上的γ射线照射量率随覆盖层厚度增加而按金格函数规律衰减。盖层物质的密度不同,γ射线照射量率的衰减程度也不相同。盖层密度越大,吸收的γ射线越多,照射量率衰减得越快。
12.1.1.2 地面γ辐射仪
地面γ测量使用的辐射仪由γ探测器和记录装置组成。最常用的γ探测器是闪烁计数器,它由闪烁体(荧光体)和光电倍增管组成,其功能是将光能转换成电能(图12-3)。当射线射入闪烁体时,使它的原子受到激发,被激发的原子回到基态时,将放出光子,出现闪烁现象。这些光子打击在光电倍增管的光阴极上,产生光电效应而使光阴极放出光电子,再经光电倍增管中各倍增电极的作用,使光电子不断加速和增殖,最后形成电子束,在阳极上输出一个将初始光讯号放大了105~108倍的电压脉冲。辐射射线强,单位时间产生的脉冲数目多;辐射粒子的能量大,脉冲的幅度也大。因此,闪烁计数器既可测量射线的强度,又可测量射线的能谱。
图12-3 闪烁计数器工作原理图
闪烁体可分为无机闪烁体(NaI、CsI、ZnS等)和有机闪烁体(蒽、联三苯等)两大类。常用的NaI(Tl)晶体是在碘化钠晶体中渗入铊作激活剂,使晶体发出可见光,并防止光被晶体自身吸收。由于晶体发光时间仅为10-7s,因而最大计数率可达105 cps。测量γ射线要使用大体积晶体,而测量X射线则使用薄晶体(厚度1~2 mm)。
辐射仪的记录装置由一套电子线路组成,闪烁计数器输出的电压脉冲经放大、甄别(选择一定幅度的脉冲)、整形(将不规则脉冲变成矩形脉冲)和计数后,由线路的读数部分显示出来。
12.1.1.3 地面γ测量工作方法
地面γ测量一般应布置在地质条件和地球物理、地球化学条件对成矿有利的地段。在地形切割、水系发育、露头良好、覆盖层较薄,并有机械晕和盐晕发育的地区进行γ测量最为有利。
地面γ测量可分为概查、普查和详查三个阶段,各阶段的工作比例尺和点线距如表12-2所示。概查在从未做过γ测量或勘查程度较低的地区进行,概查的工作比例尺为1∶1万~1∶5万,目的是为下一步工作圈出远景区;普查一般在概查阶段所选的远景区内进行,其工作比例尺为1∶2.5万~1∶1万,其任务是研究工作地区的地质构造特征,寻找异常点、异常带,研究它们的分布规律,解释异常的成因,为详查圈定远景地段;详查在选定的远景地段或矿区外围进行,采用1∶5000~1∶1000的工作比例尺,其任务是查清已发现异常的形态、规模、强度、赋存的地质条件、矿化特征等,以便对异常进行评价,为深部揭露提供依据。
表12-2 γ测量精度及点线距要求
概查和普查都采用路线测量方法,γ测量路线应与地质测量路线一致。观测采用连续测量方式,以穿越地层和构造走向为主,发现岩性变化、构造带及破碎带等地质现象时,可沿走向适当追索。为保证测线两侧范围不漏掉异常,实测路线可以是曲折的。详查采用面积测量方法,按选定比例尺预先布置测网,测线应尽量垂直穿过欲探测的地质体。
工作时,γ探测器应放在较平坦的地方测量,以避免微地形影响。测点附近的地质情况应予记录,遇到有利层位,或岩性、构造和底数有明显变化时,应适当加密测点。
用γ辐射仪测量时,所记录的γ射线照射量率是由多种因素引起的,可表示为
勘查技术工程学
其中:是测点附近岩石或土壤中放射性核素产生的γ射线照射量率;是宇宙射线产生的γ射线照射量率;是仪器底数;,为仪器的自然底数。
由于宇宙射线的照射量率随地区纬度、海拔高度和昼夜时间的变化而变化,仪器底数也受探测器内放射性核素含量、仪器受污染程度、仪器噪声强度和假脉冲数,以及仪器使用时间长短的影响。因此,辐射仪的自然底数不是一个常数。但是这种变化一般不大,在岩石底数中所占份额较小,所以可将它视为常数。不同的仪器,其自然底数也可能不等,当多台仪器进行γ测量,尤其是在环境γ本底调查、放射性核素定量测量以及为确定低于背景的γ偏低场而进行的测量中,必须测定各台仪器的自然底数,以便使测量结果能进行统一对比。
测定自然底数的方法有铅屏法、水中法、水面法等多种,其中水中法最为简便。选择水深大于1.5 m,水面直径大于2 m,无放射性污染的水域,将γ辐射仪用塑料布密封好,置于水下50 cm处,此时取得的读数即为自然底数。
岩石中正常含量的放射性核素产生的仪器读数叫做岩石底数或背景值。各种岩石有不同的底数,可按统计法求取,作为正常场值。野外工作中,凡γ射线照射量率高于围岩底数三倍以上,受一定岩性或构造控制,性质为铀或铀钍混合者,该处称为异常点。若γ射线照射量率偏高(高于围岩底数加三倍均方差),但未达到异常照射量率标准,而地质控矿因素明显,且有一定规模者,亦称为异常点。应当指出,上述标准不宜用来解决非铀地质问题。例如,找寻蓄水构造时,异常只比底数高 10%~80%。因此,解决非铀地质问题时,高于底数者即是异常点。异常分布受同一岩层或构造控制,其长度连续在20 m以上者,称为异常带。对有意义的异常点应进行轻型山地工程揭露。在做好地质、物探编录和取样分析的基础上,可提出进一步工作的意见。
在测区内镭、铀平衡遭到破坏,平衡显著偏铀时,由于铀的γ射线照射量率很小,宜采用β+γ测量,即用记录β射线的仪器测量β射线和γ射线的总照射量率。当需要查明浮土覆盖地区铀矿远景时,可采用孔中γ测量。
为了评价地面γ测量的质量,应布置检查路线。检查路线应布置在地质有利地段或工作质量有疑问的地段。检查工作量应不少于测区工作量的10%。工作质量高的标准是:未遗漏有意义的异常,检查测量曲线与原测量曲线形态无明显差异。
影响测量精度的主要因素是核衰变的统计涨落。由(11.2-16)式可知,提高精度的途径是要有足够的脉冲计数。实际工作中可采用延长测量时间,增加测量次数等方法解决。
为了保证工作质量,每天出工前后都必须用工作标准源对仪器的性能进行检查。当在某一固定点带标准源和不带标准源的读数差在统计涨落允许范围时,可认为仪器工作正常;否则应对仪器重新标定。同时,工作期间还应定期检查仪器的稳定性、准确性及多台仪器对比的一致性。
12.1.1.4 地面γ测量数据的整理及图示
(1)地面γ测量数据的整理
地面γ测量数据的整理包括将读数(计数率)换算成γ射线照射量率、确定岩石底数、计算岩石γ射线照射量率统计涨落的均方差等。
为了求得岩石底数,首先要根据实测γ射线照射量率绘制频数直方图(或概率分布曲线)。如果岩石γ射线照射量率服从算术正态分布,则岩石照射量率(算术)平均值为
勘查技术工程学
均方差为
勘查技术工程学
式中 n 为统计分组的组数;为第i 组的频数;为第i 组的组中值。
如果岩石γ照射量率服从对数正态分布,则岩石照射量率几何平均值和均方差为
勘查技术工程学
取作为岩石底数,+3σ作为异常的下限(非铀地质工作除外)。
岩石底数和异常下限也可在累积频率展直图或累积频率分布曲线上直接读取。
(2)地面 测量成果的图示
地面γ测量的成果图件主要有:γ照射量率剖面图、γ照射量率剖面平面图、γ照射量率等值线平面图和相对γ照射量率等值线平面图等。
γ照射量率等值线图按±3σ、±2σ、±σ勾绘。不同岩石有不同的底数,且不同岩石γ射线照射量率的变化幅度(即均方差)也是不同的,这些都会影响γ照射量率等值线图的精度。为此,可以在每种岩性范围内按各自的+σ、+2σ、+3σ将γ场划分为偏高场、高场和异常场三级,然后分别把各种岩性γ射线照射量率等级相同的点连接起来(不论它们的岩性是否相同),这样便构成了一幅相对γ照射量率等值线平面图(图 12-4)。这种图避免了岩石背景值不同造成的干扰,较全面地反应了各种不同岩性的γ场特点,能清楚地反映γ晕圈与矿化、构造的关系,有利于研究矿化规律及推测成矿有利地段。
图12-4 某地区相对γ照射量率等值线平面图
12.1.1.5 地面γ测量的资料解释及实例
地面γ测量的资料解释是定性的,因为γ测量的探测深度浅,1~2 m。一般只能圈出地表放射性核素增高的地段,难以发现埋藏较深的矿体。此外,γ射线照射量率的大小并非总是反映铀的富集程度。因为铀系中主要γ辐射体都是属于镭组的核素,所以产生γ异常的源主要是镭而不是铀。
放射性核素在自然界中广泛分布,γ测量中发现异常并不难,但评价异常就不容易了。当矿床出露地表或处于氧化带中,而附近又有断裂迹象时,铀容易受风化淋滤作用而被酸溶解带走。其结果是镭的数量增大,平衡偏向镭,从而出现γ射线照射量率很高而铀并不富的现象。若被运走的铀在适当的环境下被还原而沉积下来,或在还原环境下镭被带走而铀又被溶解得很少,就会发生平衡偏向铀的情况。这时γ射线照射量率不高,但铀却很富。因此,必须特别注意用铀镭平衡系数确定测区内铀、镭是否处于长期平衡状态,而不能仅仅依靠γ射线照射量率的大小来评价异常。同时,还应综合应用异常点(带)的地质、地球化学和其他地球物理(包括射气测量、β+γ测量等)资料进行分析,才能对异常做出正确的判断。
图12-5 某地区地质、相对γ照射量率综合平面图
地面γ测量具有仪器轻便、方法简单、工作灵活、成本低、效率高等特点。除用于直接寻找铀、钍矿床和确定成矿远景区外,还用于地质填图,寻找与放射性核素共生的其他矿产,探测地下水以及解决其他地质问题。
图12-5是地面γ测量寻找铀矿床的实例。该地区曾发现燕山运动早期花岗岩体,其主要岩性为中细粒花岗岩。区内浮土覆盖面积较大,岩浆活动频繁,构造复杂,呈东西向分布。γ测量圈定了两个异常和两个偏高场,都有一定的规模,经地表揭露后它们依然存在。对偏高地带又做了射气测量、铀量测量和伴生元素找矿等工作,结果均有显示。经勘查揭露,在1、2号异常及3号偏高地带发现铀矿,4号偏高地带见到了铀矿化。
12.1.2 地面γ能谱测量
如前所述,铀系和钍系都有几个主要的γ辐射体。因此,在铀、钍混合地区,用地面γ测量方法不易判定异常的性质,这时采用地面γ能谱测量往往能取得良好的地质效果。
12.1.2.1 地面γ能谱仪和仪器谱
地面γ能谱仪的闪烁计数器可将γ射线的能量转换成电脉冲输出,输出脉冲的幅度与γ射线的能量成正比,因此能谱测量实际上是对脉冲幅度进行分析。完成这个功能的电路称为脉冲幅度分析器。其原理见图12-6(b),它由上、下甄别器和反符合电路组成。甄别器是一种只允许幅度高于某一数值(称之甄别阈值)的脉冲通过的装置。上甄别器的阈电压较高,只有较大幅度的脉冲(如9号脉冲)才能通过。下甄别器的阈电压较低,除了所有能通过上甄别器的脉冲(如9号脉冲)可以通过外,幅度介于上、下甄别器之间的脉冲(如3、5、8号脉冲)也能通过。两甄别器输出的信号均送到反符合电路。反符合电路的特点是,当上、下甄别器有相同的信号同时输出时,使这些信号在反符合电路相互抵消。因此,反符合电路输出的只是介于上、下甄别阈电压之间的脉冲(3、5、8号脉冲),然后进行计数和记录。
上、下甄别阈电压的差值称为道宽。道宽固定以后,通过调节下甄别阈电压(上甄别阈电压相应地变化),可把幅度不等的脉冲逐段分选出来,这种脉冲幅度分析方法称为微分测量。所测得的谱线称为微分谱。
如果脉冲幅度分析器只用一个下甄别器,则所有幅度超过下甄别器阈电压的脉冲(图12-6(a)中3、5、8、9号脉冲)都被记录,这种脉冲幅度分析方法称为积分测量。所测得的谱线称为积分谱。
实际工作中,γ能谱仪测得的γ能谱不是线谱,而是因各种因素复杂化了的仪器谱(图12-7),它是γ射线通过物质(岩石、土壤、能谱仪探测元件等)产生光电效应、康普顿散射和电子对效应等,使能谱发生了很大变化后形成的,是一种连续谱。与线谱相比,U、Th、K的上述特征峰峰位不够突出,但仍能分辨。
图12-6 脉冲幅度分析器原理
图12-7 NaI(Tl)测得的微分仪器谱和U、Th、K道的选择
12.1.2.2 U、Th、K含量的计算
γ能谱仪用一个积分道(>50 keV)记录某一能量阈以上的总γ射线计数率,还用三个微分道分别测量γ射线三个能谱段产生的计数率。其中钾道道宽0.2 MeV,所鉴别的γ谱段中心可选在40K特征峰1.46 MeV处;铀道道宽0.2 MeV,谱段中心可选在铀系214Bi特征峰1.76 MeV处;钍道道宽0.4 MeV,谱段中心可选在钍系208Tl特征峰2.62 MeV处。三个谱段都选在高能区,可以减少散射γ射线的影响。三个谱段又相互独立,且每一谱段中,目标核素谱线占主要成分,有利于提高计算方程解的稳定性(图12-7)。
设钾、铀、钍道的计数率(已减去底数)分别为I1、I2、I3(单位为cpm),则它们与U、Th、K的质量分数w(U)、w(Th)、w(K)(单位分别为10-6、10-6、%)的关系为
勘查技术工程学
式中系数ai、bi、ci(i=1,2,3)称为换算系数,分别表示单位含量的铀、钍、钾在不同测量道的计数率(单位分别为cpm/10-6、cpm/10-6和cpm/%),需在铀、钍、钾标准模型上实测确定。
解上述方程组,可求得铀、钍、钾的质量分数
勘查技术工程学
式中
勘查技术工程学
12.1.2.3 地面γ能谱测量的工作方法及成果图件
地面γ能谱测量与地面γ测量的工作方法类似,但地面γ能谱测量需要按照预先布置的测网定点、定时读数,读数的时间一般为1min。微机化γ能谱仪实现了现场自动数据采集、数据初步整理及现场绘制剖面平面图。
在室内,可将野外采集的数据直接输入计算机,在屏幕上快速形成各种图件,并进行人机交互解释。
地面γ能谱测量的成果图件有:铀、钍、钾含量剖面图、剖面平面图和等值线平面图,有时还要绘制钍铀比[w(Th)/w(U)、钍钾比w(Th)/w(K)、铀钾比w(U)/w(K)]剖面图或等值线平面图。
12.1.2.4 地面γ能谱测量的应用
地面γ能谱测量可以直接寻找铀、钍矿床,也可寻找与放射性核素共生的金属及非金属矿床,利用铀、钍、钾含量及其比值的分布资料,还可推测岩浆岩和沉积岩的生成条件及演化过程,探测成矿特点和矿床成因等。
图12-8是应用γ能谱测量寻找含金构造带的实例。在含金矿脉附近,γ总量曲线和K含量曲线出现低值,U、Th含量曲线出现高值,而w(U)/w(Th)、w(U)/w(K)、w(Th)/w(K)值形成明显的异常。综合这几条曲线,可确定含金矿脉的位置。根据矿脉两侧K含量曲线两处出现高值的位置,可大致估计钾化带的宽度。
图12-8 山东某地地面γ能谱测量曲线
关于“核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研究的简介)”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[dazhoutv]投稿,不代表大洲号立场,如若转载,请注明出处:https://dazhoutv.com/zhishi/202507-5502.html
评论列表(3条)
我是大洲号的签约作者“dazhoutv”
本文概览:网上有关“核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研究的简介)”话题很是火热,小编也是针对核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研...
文章不错《核方法与累积量随机学习方法研究(关于核方法与累积量随机学习方法研究的简介)》内容很有帮助