摘要:本文簡要闡述了RCM理念、分析方法在大亞灣核電站的應用,描述了RCM分析成果指導現有狀態監測和維修運行活動的程序。自1998年引進RCM理論后經過3年多的應用及推廣,規范了日常狀態監測及分析診斷工作,在實際應用中取得了很好的收益。現在已基本上建立一套適合大亞灣核電站自身特點的RCM分析體系。闡述了RCM分析成果在提高系統可靠性方面和降低系統及設備的運行/檢修成本方面帶來的變化,介紹了利用ENTEK狀態監測軟件分析設備故障及設備故障處理跟蹤流程,以GST為例介紹了gSE強大的故障診斷功能。通過本文可以使讀者初步了解核電站采用RCM理論的必要性和它對核電站安全、穩定、經濟運行所做出的貢獻。
關鍵詞:RCM,可靠性維修、狀態監測,應用
1. RCM理念及其在大亞灣核電站的應用
1.1 RCM分析理念
以可靠性為中心的維修-RCM(Reliability-Centered Maintenance)是全面客觀地評價和決策設備維修方式方法,提高預測維修重要性和權威性。它起源于70年代末的美國航空工業,目前已在國際上很多行業得到運用,在美國、法國、南非等國家的核電站早已普遍應用了RCM分析技術。
人們的維修觀念隨著科學技術迅速發展也在不斷的變革,對設備故障的觀點也發生了變化。20世紀50年代以前的設備故障觀點比較簡單,認為設備越陳舊越可能發生故障。在60年代隨著設備復雜程度的提高,產生了“浴盆”曲線的觀點。到70年代末隨著高科技的發展,人們對設備故障的新研究認為:設備的實際故障曲線不是一種單一的“浴盆”曲線,而是六種曲線,其中三種與時間有關的故障模式曲線僅占所有故障模式的11%,而89%的故障模式與運行的時間無關。
RCM分析體系正是在這些研究的基礎上發展起來的新的理念:并不是修得越頻繁,設備就越可靠;同時RCM把我們從管理故障模式的觀念轉到了管理故障影響和故障后果的觀念上來。RCM是用來確定任一設備在運行環境下保持實現其用戶需求功能所必須的活動的一種科學方法。亦即,通過RCM分析方法,確定對哪些設備采取糾正性維修(CM)策略,對哪些設備采取定期維修(PM)策略,對哪些設備采取狀態維修(PDM)策略。而通過這些必須的維修活動,確保系統設備保持實現其用戶需求功能。
1.2 RCM在大亞灣核電站的應用
RCM的長處在于為確定哪些預防性維修是技術可行的、多長時間做一次預防性工作和為什么要做預防性工作提供了一個簡單、準確和容易理解的判據。設備的定期大修只有在故障后果嚴重并無法準確預測且故障與時間有關的情況下才有必要,有條件則盡可能采取預測性維修。
RCM方法強調設備維修的及時性和準確性,所謂及時性就是避免系統功能喪失,所謂準確性就是盡量達到設備安全壽命極限,兩者是辨正統一的。所以通過RCM分析不僅降低了運行、維修成本,實質上也保證了系統的可靠性。
大亞灣核電站從1998年開始探索應用RCM的可行性,并于1999年在美國籍RCM專家指導下,進行了冷凝水抽取系統(CEX)的RCM分析試點工作,并取得了很大成功。隨后開始在大亞灣核電站的推廣RCM理念,完成所分析系統的《維修導則》(Maintenance Base)和《維修大綱》的優化和升版。《維修導則》則是RCM分析小組的分析成果。完成RCM分析以下幾個過程:
確定所分析的系統設施的功能和性能標準(編寫系統功能);
確定功能失效模式,明確部件故障到什么程度才不能實現其功能,以及引起每種可能的功能喪失的原因(編寫信息工作單);
分析故障影響和故障后果(編寫信息工作單);
利用決策樹,確定對不同設備所采用的維修類型和頻度(編寫決斷工作單和FFI計算);
對RCM分析結果進行審查,將分析結果與現有的維修大綱作分析比較。
根據最終審定的成果形成《維修導則》,并修改維修大綱。
根據修改后的維修大綱,明確各個部門和專業的職責和任務,然后按照一套完整的維修管理體系保證設備的可靠運行。
3.RCM分析成果給電站設備管理帶來的變化
3.1提高了系統設備的可靠性
RCM分析總是將有安全性和影響環境的故障后果評估進行預先判斷,在分析過程中對此類故障給予高度重視,即使不能完全排出故障,也應把此類故障所帶來的風險真正降到非常低的水平。下面以冷凝水抽取系統(CEX)的部分分析結果為例,闡述在提高系統可靠性方面帶來的變化;
●凝結水抽取系統(CEX)是汽輪機的重要輔助系統,它設計有3臺容量為50%的凝結水泵,其中兩臺凝結水泵運行1臺泵備用。如果兩臺運行的凝結水泵有1臺故障停運,而備用泵不能自動啟動,造成的后果輕則發電機甩負荷到50%Pn,嚴重時會引起汽輪機跳閘,反應堆停堆。大亞灣核電站曾經發生過3次兩臺運行泵中的一臺泵故障跳閘,其中有2次備用泵不能自動啟動,備用泵自動啟動成功的失效概率高達到66.7%。針對這一故障模式,RCM小組在分析過程中發現管理備用泵隱蔽性故障模式的定期試驗程序存在明顯的缺陷:盡管機組每次換料大修后也進行備用泵的自動啟動試驗,但試驗時所采用的運行方式同實際運行方式完全不一樣。試驗時模擬一臺CEX泵運行,兩臺CEX泵備用,當運行泵跳閘時優先備用泵自動啟動,如果優先備用泵自動啟動不成功,延時1s后次級備用泵自動啟動。而實際運行時兩臺CEX泵運行,一臺CEX泵備用,這種運行方式下備用泵的自動啟動邏輯回路同有兩臺泵備用時的自動啟動邏輯回路完全不一樣,但我們的定期試驗并沒有針對這一隱蔽性故障模式進行管理。在RCM分析的決斷工作單中,修改了定期試驗程序,調整了試驗方法和頻度。在分析結果應用到實踐中的兩年多的時間內,大亞灣核電站又發生過3次兩臺運行泵中的一臺泵故障跳閘,但是3次備用泵都能順利地自動投運。使備用泵自動啟動成功率提高到100%。理論上避免2次機組甩負荷故障,為核電站挽回重大的經濟損失。
●RCM分析前CEX泵進出口隔離閥沒有密封性試驗,其直接后果是一旦泵在機組正常運行中故障需要進行在線檢修時,該泵將因閥門無法有效隔離而不能檢修,機組將長時間失去備用,大大降低機組運行的可靠性。RCM分析后增加了密封性試驗。在密封性試驗中,果然發現泵進出口隔離閥存在設計缺陷,使得無法對CEX泵進出口隔離閥有效隔離,從而提出對隔離閥進行改造,改造后密封效果良好。
●RCM分析前CEX系統三臺泵實行的是定期檢修,檢修周期較短,檢修質量不能保證,檢修再鑒定經常出現泵振動比檢修前大的情況,這樣,浪費了大量時間、精力和金錢,卻起到了反面的效果。現在該泵采用狀態檢修,通過周期性振動測量來確定設備是否需要檢修,節約了大量的維修成本。
3.2降低系統和設備的運行及檢修成本
RCM分析方法的應用對企業最大的好處是在提高系統設備可靠性的同時降低了運行維修成本。RCM理念認為幾乎所有的解體大修本身就是一種故障的形式。從運行系統中拆除一個設備進行解體大修,就意味著這個設備不能為系統運行提供它應該提供的服務。因此,解體檢修的目的就是為了使設備提前進入一個后果相對小的故障狀態,以避免在運行中發生更為嚴重的后果。在分析和決斷過程中,分析和判斷設備故障的影響及后果,判斷運行設備是否有備用,備用設備是否可以在線維修,設備故障是否與時間有關,是否可以采用狀態監測技術捕捉潛在故障點等等,從而決定對該設備所采取的維護方式:對故障與時間無關且故障后果不嚴重可以在線維修的設備取消預防性維修而采取糾正性維修方式,對于故障后果嚴重的設備如果能夠采用狀態監測技術捕捉到設備潛在故障點,先采取延長維修周期的方式,到檢修周期末期,根據狀態監測判斷設備的性能指標是否下降,如果性能指標下降可提前檢修,如果性能指標未下降可繼續延長檢修周期。下面以汽輪機潤滑油頂軸盤車系統(GGR)、凝結水抽取系統(CEX)的部分分析結果為例,闡述在降低系統和設備的運行及檢修成本方面帶來的變化:
1、在汽輪機潤滑油頂軸盤車系統中,交流輔助潤滑油泵在系統中起著重要作用,但它不是一個連續運行的設備,運行時間較短,采取的其它維修策略可以保證它的功能不被喪失,并可發現它的潛在故障點。因此在決斷中取消交流輔助潤滑油泵電機3年一次的定期檢修。
2、在汽輪機潤滑油頂軸盤車系統中,直流應急油泵,在系統中起著非常重要的保護作用,但它僅是一個應急備用的設備,采取的其它維修策略可以在應急狀態下保證它的可用。因此在決斷中將直流應急油泵的泵體的解體檢修周期從6年延長至9年,同時取消直流應急潤滑油泵電機每運行3000小時的解體檢修。
3、由于有兩臺冷油器互為備用,并可在線隔離維修。因此在決斷中取消冷油器每5年全面檢查和冷油器季度檢查。
4、在凝結水抽取系統(CEX)中,電動機和泵的定期解體檢修均已取消,同時加強了對電動機和泵的狀態監測。一旦電動機和泵真有問題了,基于狀態監測的結果進行的維修將更具針對性。到目前為止,我們已對6臺CEX電動機中的5臺進行了解體大修。據檢修人員介紹,尚未發現已解體電動機有任何缺陷,即便因軸承漏油換下來進行解體大修的2CEX001MO也沒有發現換下來的軸承的缺陷所在(軸承漏油的根本原因到底是什么呢?---需作根本原因分析),倒是205大修對其進行品質再鑒定時一啟動就出現異常噪音而被迫停運、換下再次解體大修。這說明一個問題:不恰當的維修會降低設備的可靠性,同時維修成本成倍的增加。
5、取消CEX系統中電動機10年解體解體檢修項目后系統和設備的可靠性沒有降低,維修費用卻得到了很大的節省:
修1臺CEX電動機人工費:5*10*600=30000元
更換電動機軸承:2*920*8.3=15272元
初步估計解體1臺電動機就算其它部件沒有問題,最少也得花費4.5--5萬元。6臺電動機花費27--30萬元。
這僅僅從一個系統的一個設備來考慮,如果從整個系統乃至整個電站來考慮,這筆費用的節省將是十分可觀的,并隨著RCM分析工作的不斷深入而產生越來越可觀的效益。
4. 狀態監測在大亞灣核電站RCM中的作用
RCM是工作重點是確定生產設備中哪些設備應該采用預測維修,哪些采用預防維修,哪些可用故障維修。這樣就能保障設備在合理有效管理機制上發揮更大的作用。而了解設備運行狀態第一手資料的途徑就是用狀態監測手段對設備進行全面普查,為RCM系統決策提供科學的依據。借助RCM來合理確定狀態監測范圍和采集數據周期,使恩泰克狀態監測技術在大亞灣核電站發揮積極能動的作用。前者側重戰略上,后者著重在戰術上。
實現了狀態監測技術與RCM的無縫結合,恩泰克狀態監測系統不僅為狀態監測者提供分析數據,而且為RCM及MAXIMO系統提供了鏈接通道。通過向MAXIMO提供設備狀態評定報告,根據這些信息決定生產系統是否可繼續健康運行;它也可直接向維修部門提供信息,使該部門專注于設備中有問題的部件,而非簡單地按計劃表運作,從而優化其維修資源。
大亞灣核電站恩泰克狀態監測系統是由多用戶Enshare恩泰克資產管理及故障監測及診斷軟件和7臺DataPAC1500數據采集器組成。以滿足對RCM確定的關鍵和重點設備進行定期監測分析和診斷工作。
大亞灣核電站目前振動監測主要有汽輪發電機,柴油發電機 各類水泵,各類風機,空氣壓縮機和一些靜止機械共計400余臺,通過對每個系統進行RCM分析,確定各類旋轉機械的監測周期,振動測量人員利用DataPAC1500數據采集器將振動信息采集并上傳至專用服務器,故障診斷人員利用其Enshare軟件強大的分析診斷功能,對測量的振動信息做進一步評價和分析處理,對于設備的初期故障,采用的處理方式:縮短測量周期加強監測,并通過郵件的方式告知相關部門(包括運行和維修)共同關注設備的異常變化;對于故障信號比較明顯,振動噪音都發生突變的設備,會立即通知運行人員停運該設備,并通過comis系統發出一個工作申請(comis系統是大亞灣核電站根據MAXIMO軟件改編的一套工作過程管理系統),由維修人員根據工作申請的處理意見對設備進行定點維修,振動診斷人員跟蹤維修人員的處理過程,并在故障處理完成后做再鑒定試驗,以確定故障是否已經排除,設備是否可用。
當發現設備異常趨勢時,及時分析和診斷。并將分析結果通報給comis系統。該系統的基本功能是從業務方面使得維修系統和組件處于良好的有序狀態,它不僅能控制維修業務的進程,而且能為有效的管理工作提供技術信息。計算機維修管理系統為維修工作提供了有力的工具,它可用來對諸多維修管理因素,如系統組成、人力資源、工作流程、備件清單、儲備過程和向現場發貨等進行計劃和日程安排,并且可對維修結果進行文檔記錄。一個有效的維修管理系統的實施可通過制定合理的人員、工具和材料庫存等措施使企業處于良好的運營狀態。
5.利用ENTEK系統準確診斷設備故障
大亞灣核電站從調試到正式運行,在振動方面已經掌握了多種設備故障診斷手段,可以進行振動幅值,頻譜,相位,噪音等多種分析。隨著電站預測性維修活動的開展,對設備監測水平提出了更高的要求。在這種情況下,我公司于98年引進了美國ENTEK IRD公司先進的設備預測性維修軟、硬件系統,通過定期采集、輸入各種數據形成一套相對完整的設備健康檔案。同時利用該系統先進的特征頻率法及獨有的滾動軸承尖峰能量法對滾動軸承,齒輪箱等進行專門的監測,利用這一手段,我們先后診斷出SRI(常規島冷卻水系統)水泵和GST(發電機定子冷卻水系統)電機等36臺旋轉設備滾動軸承故障,故障診斷準確率超過90%,。下面以2號機GST101PO為例,較詳細地描述了電機軸承故障的診斷和處理過程。
GST系統的主要作用是排出發電機定子繞組和端子運行時產生的熱量,每臺機組包括兩臺水泵,正常運行時一臺工作,一臺備用。任一臺損壞將導致系統可靠性降低,直接影響汽輪發電機組的安全運行,關系重大。
99年5月份,2GST101PO運行時電機驅動端發出異常噪音,現場測量時通頻振動值并不大(2.8mm/s RMS以下),頻譜內也無異常分量,與4月份該電機維修更換后所測值相差不大。但噪音從何而來呢?通過滾珠軸承尖峰能量和特征頻率分析,判斷電機驅動端軸承異常。
附圖三:2GST101PO故障軸承尖峰能量頻譜圖 附圖四:2GST101PO故障軸承6KHz速度頻譜圖

首先該點尖峰能量值從一個月前的1左右增大到9,變化大,其它正常運行的同類電機同測點處值僅為1左右;另外,從該點的尖峰能量譜上應用特征頻率分析可見較明顯的外環故障頻率(BPOR)及其倍頻(附圖三),表明軸承外環存在故障可能。如果軸承存在故障將產生沖擊,會激起軸承的固有頻率,在速度頻譜上應該可以看到高頻分量,所以采用6KHz頻率范圍再次測量該點的速度譜,果然在1370Hz左右有一峰值(1.68mm/s RMS,附圖四)。因為尖峰能量分析無固定標準可循,判斷主要以同類軸承相比較為依據,而我們對此類軸承尚無經驗,且速度譜中高頻分量不算太大,所以決定密切監測,觀察其發展趨勢。
半個月后再次測量,尖峰能量方面變化不大,但速度譜中1370Hz高頻分量已增大至7.5mm/s RMS,已不可接受。立即停機檢查,發現該軸承外環損傷嚴重,其圓周1/3段存在較深劃痕。
更換新軸承后,振動狀態良好,由其尖峰能量頻譜圖可見,外環故障頻率分量已消失(附圖五)。其振動頻率圖上的1370Hz分量已大大減小(附圖六)。
此例充分說明了運用新技術能及時發現設備故障,同時相對完善的設備歷史數據庫在進行診斷時,通過同類設備的橫向、縱向比較,將更有效地發揮作用。
6、結束語
RCM方法在大亞灣核電站應用五年來,已完成RRI、CEX、CFI、GGR等15個系統的RCM分析,在保持系統設備安全、可靠、經濟運行方面取得了顯著的效果。RCM較好地解決了“為什么修、何時修、修什么”的問題。目前,以可靠性為中心的維修在大亞灣核電站的推廣和應用已正式列入公司的五年發展計劃。到2004年底,我們計劃將完成19個核島系統、30個常規島系統、30個電氣系統的RCM分析,基本上覆蓋了電站的重大設備及相關系統。在實際運用過程中,新的設備故障模式還會不斷出現,我們應以動態的眼光來看待RCM的分析成果。及時反饋、不斷更新,使RCM分析成果——《維修導則》以及派生出來的《維修大綱》成為真正意義上的“LIVING PROGRAM”,使更好地起到指導運行、維修的目的。確保核電站安全、可靠、高效運行。
參考文獻:
[1] Reliability-centered Maintenance(RCM ),John Moubray,Second edition 1997,Reprinted 1997,1998
[2] 以可靠性為中心的維修,(英)J·莫著,石磊、谷寧昌譯,機械工業出版社,1995
[3] 工業企業設備管理,張翠鳳,華南理工大學出版社,1997.5
[4] 以可靠性為中心的維修及其實施意義,李曉明、劉敏、景建國,大亞灣核電,2001.1
作者簡介:
陳志林,男,1971年出生,工程師,畢業于東北電力學院自動控制專業,現在大亞灣核電站從事故障診斷工作