广告广告
  加入我的最爱 设为首页 风格修改
首页 首尾
 手机版   订阅   地图  繁体 
您是第 7225 个阅读者
 
发表文章 发表投票 回覆文章
  可列印版   加为IE收藏   收藏主题   上一主题 | 下一主题   
mingsheng
个人头像
个人文章 个人相簿 个人日记 个人地图
知名人士
级别: 知名人士 该用户目前不上站
推文 x2 鲜花 x16
分享: 转寄此文章 Facebook Plurk Twitter 复制连结到剪贴簿 转换为繁体 转换为简体 载入图片
推文 x0
[UNIX] 医生就在你心里
在 Sun Solaris 10 作业系统中「预测式自我修复」技术首次崭露头角,大幅减少停机时间与管理的复杂度。

2004 年 9 月 7 日:如同我们身体的健康一样,网路问题的最佳处方,就是预防医学。这表示必须随时得密切注意企业资讯系统的状态,并且在轻微问题刚刚出现之初随即能够予以排除,而不致累积酿成重大危机。不过,传统上只有复杂而昂贵的额外选购软体,才具备系统监控与反应的功能。

在 Solaris 10 作业系统 (Solaris OS) 中,Sun 在其核心中加入一个系统「医生」:预测式自我修复 (Predictive Self-Healing, PSH) 技术。此项创新特色,是 Sun 整个 PSH 架构中的第一个元件。

Solaris 10 OS 中的 PSH 特色,可确实降低风险并增加可用性。PSH 功能可让 Sun 的系统精准地事先预测出元件的可能错误状况,并进而在系统全面遭逢浩劫前将问题予以缓解,让您的系统从被迫停机的噩运中能够全身而退,并能针对系统错误予以修复。

连接 Sun.com,一窥 Solaris 10 完整面貌
领先业界、即将发行的 UNIX 平台 -- Solaris 10 OS,整合了威力强大的新功能,能够缔造出整体效能、可用性、以及安全性的极致表现。除了本文所介绍的预测式自我修复功能以外,Solaris 10 还含括了下列革命性的新技术:

N1 Grid Containers (N1 网格容器) 技术对于系统的虚拟化而言,它可提供突破性的方法,让每一个单一建置例项上可支援超过 8,000 个软体分割区,大幅提升硬体资源的利用率。

DTrace 是一个全面型的动态追踪架构,让所有管理人员、开发人员、以及服务人员能够简洁有力地应付来自作业系统、以及使用者程式所可能制造出来、各种捉摸不定的疑难杂症。

Project Janus 是 Solaris 10 的新技术之一,它可以让您创造出一个能够以接近原生速度执行多种 Linux 应用程式的环境。

透过 PSH 的功能,您将能够:

在面对系统错误的威胁下将系统与软体的可用性予以最大化
降低系统维修的复杂度
减少运作成本进而节省时间与金钱
PSH 技术具备可扩充性、可延伸性、以及可携带性;且 Sun 将会把此项技术结合到产品之中,以提供一个共通的服务与管理经验。

「藉由预测式自我修复技术,每一个应用程式、子系统、以及硬体元件,都能整合成一个整体架构,不仅可诊断出错误的存在,还能立即采取维持系统可用性的必要措施。」Sun 的 Solaris Kernel 开发小组资深工程师、也是 PSH 技术主要创始人的 Mike Shapiro 做了以上说明。

Solaris 10 作业系统中的预测式自我修复特色
Sun 公司上下所全力推动的自我修复系统,在 Solaris 10 OS 中呈现为两个主要的元件:Solaris Fault Manager 以及 Solaris Service Manager 软体。此次推出的第一版 PSH 功能,除了有自动重新启动应用程式服务的功能,还针对 CPU、记忆体、以及 I/O 汇流排结合元件,实作了预测式自我修复功能。

Solaris 10 OS 的 PSH 特色拥有下列诸多优势:

透过预测式的诊断与错误元件的隔离,进而改善系统与服务的可用性。
在毫秒的时间内即可完成对于软、硬体元件的自动诊断与重新启动功能。
简化的服务管理。
快速而简易的问题排除,还包括知识库文章的连结。
对于新出现问题的调适非常快,而且可以在不需停机的状态下立即完成更新。
事实上,PSH 的功能因为颇具价值,所以 Sun 在创造 Solaris 10 OS 本身的过程便非常广泛地加以使用,以使开发过程更加顺利。

「PSH 在 Solaris Kernel 开发小组的入口机器上侦测到某个故障的 CPU,而该机器是 Solaris OS 程式码的主要储存所在。」Shapiro 解释道,「PSH 马上将该 CPU 强迫离线,让它没有机会因为功能失常而造成伺服器的当机-甚至造成其他 Solaris 10 OS 功能开发工作的延误。」

Solaris Fault Manager 软体
如果自我修复系统侦测到某个问题,它便会动态地在造成系统错误之前,将 CPU、I/O 设备及 (或) 记忆体区域予以强迫离线。在 Solaris 10 OS 中,Solaris Fault Manager (错误管理员) 软体可将有问题的元件予以隔离并停止其功能,协助您在完全没有知觉到任何潜在问题的状况下,确保服务的不中断。

Solaris Fault Manager 软体只需要几秒的时间即可自动侦测出问题,而非透过一流的 IT 人员花上好几天的时间来处理问题。如果软体发生错误、硬体元件故障、甚至是软体的组态设定错误时,重大的应用程式与基本的系统服务仍然可以不受中断地持续运行。而且整个系统是开放的,让管理人员和现场人员都能够观察到这个诊断系统的活动。

搭配 PSH 技术的系统会发出容易解读得诊断讯息,它会连结到 Sun 知识库中的文章,里头会清楚地指导管理人员如何采取必要人为介入。因此,从自动诊断开始,一直到人为介入为止,整个程序所花费的时间比以往大大地减少了许多。

Solaris Service Manager 软体
Solaris Service Manager (服务管理员) 软体是 Solaris 10 OS 中 PSH 技术的另外一半。它会将应用程式的服务变成头等物件,方便管理人员能够以统一的方式来进行观察与管理,并且具备了自动重新启用与管理服务的功能。

如果某些服务不小心被管理人员所终止、或是因为某个软体程式错误而遭到中止、或者只是很无辜地受到基础硬体设备问题的牵累,Solaris Service Manager 软体都能够重新启用该服务。

此外,Solaris Service Manager 软体对于共同的管理任务,可以发挥简单化与安全化的效果,就像是将服务停用或是变更属性一样地简单。Solaris Service Manager 软体同时也可以根据服务之间的依存关系,以平行方式来启用服务,进而加快系统开机的速度。而「复原」的功能则提供了简易的变更还原能力,轻松免除人为失误可能造成的麻烦。

Solaris Service Manager 软体针对传统的 Solaris OS 服务,在不需要任何异动的前提下即能提供观察能力 (observability) 与错误隔离功能。开发人员只要在他们的软体中加入一个简单的 XML 档案,便可以让大部分既有应用程式能够利用 Solaris Service Manager 软体的完整功能。

建立更好的反馈机制
当客户搭配 PSH 技术的网路在收集有关系统问题的资讯时,存在于 Sun 与这些客户之间的强大反馈机制也随着快速成长,进而促使持续不断的改良与精进。

「整个大概念就是,PSH 的功能可以协助 Sun 提供一个量化的方式来检视企业系统的可用性,如此可进一步促使做出更能掌握状况的采购决策。」Shapiro 这样表示。「PSH 技术让我们在与客户互动并提供服务的过程中,变得更具先发性 (proactive) 与预测能力 (predictive)。」

PSH 技术的下一步?
PSH 技术为 Solaris 10 OS 系统带来了令人称奇的、具备更高可用性的新技术。Solaris 10 OS 中的另一个主要元件:ZFS,同样也涵盖了自动修复的功能。请造访 sun.com 参阅 9 月 14 日的专题报导,其中有关于 ZFS 完整功能介绍;它是一个垂直整合的储存系统,可提供端对端的资料完整性、非常大 (128 位元) 的容量、以及极为简易的管理动作。

如果要为企业达成更高的可用性,您也可以透过 Sun Cluster (丛集) 软体,为部署在 Solaris OS 系统上的服务,新增冗余且跨机器之当机接手 (fail-over) 功能。与 Solaris 10 OS 内 PSH 功能运作极为相似的 Sun Cluster,与受到监控的元件之间可以非常和谐地共处,进而能够凭藉着与硬体之间的紧密整合,进一步提升可用性。

现在就来试试预测式自我修复技术
您只要到 Software Express for Solaris 10 OS release,即可下载 Solaris Fault Manager 软体、以及 CPU、记忆体、与针对 UltraSPARC 处理器系统的 I/O 支援。Sun 预计在下一次的发行 Solaris OS 的 Software Express 当中会同时发行 Solaris Service Manager 软体元件。您也可以加入有关 PSH 技术的讨论群组,内容也包括了 Solaris Fault Manager 软体。

对于 PSH 架构而言,Solaris 10 OS 只是一个开端。未来持续的更新,除了会加入针对其他系统元件的自我修复功能,也会针对 AMD Opteron 的 x86 系统继续将类似的硬体诊断功能予以涵盖进来。至于 PSH 架构,则设计为针对升级并允许在加入新的诊断功能时,完全不会造成系统的停机。

「Solaris 10 OS 中的预测式自我修复功能只是迈向未来的第一步。」Shapiro 最后指出,「我们正在做的,就是从最底层的硬体/软体堆叠开始往上,逐步地将自我修复技术建构到我们的系统之中。最后的结果,将会是一个具备可扩充性而且非常有效率的架构,并且能够非常快速地诊断出问题的发生并立刻做出调适动作,同时并将问题予以隔离,完全不会导致系统停机的现象。」


[ 此文章被andyz在2005-05-18 19:41重新编辑 ]



献花 x0 回到顶端 [楼 主] From:台湾数位联合 | Posted:2004-10-16 12:09 |
boss90926
数位造型
个人文章 个人相簿 个人日记 个人地图
路人甲
级别: 路人甲 该用户目前不上站
推文 x0 鲜花 x0
分享: 转寄此文章 Facebook Plurk Twitter 复制连结到剪贴簿 转换为繁体 转换为简体 载入图片

谢谢大大提供 我好需要这ㄍ东C   3Q~~~~~~~~~~~~~~


献花 x0 回到顶端 [1 楼] From:台湾中华电信HINET | Posted:2007-07-02 20:00 |
setiufo 手机
个人文章 个人相簿 个人日记 个人地图
小人物
级别: 小人物 该用户目前不上站
推文 x1 鲜花 x62
分享: 转寄此文章 Facebook Plurk Twitter 复制连结到剪贴簿 转换为繁体 转换为简体 载入图片

谢谢大大的详细介绍 表情


献花 x0 回到顶端 [2 楼] From:台湾和信超媒体宽带网 | Posted:2007-07-02 23:16 |

首页  发表文章 发表投票 回覆文章
Powered by PHPWind v1.3.6
Copyright © 2003-04 PHPWind
Processed in 0.103432 second(s),query:16 Gzip disabled
本站由 瀛睿律师事务所 担任常年法律顾问 | 免责声明 | 本网站已依台湾网站内容分级规定处理 | 连络我们 | 访客留言