SEAGATEとHGSTの話

最近はマニアックなトピックが続いていますが、先日HDD事件の続報です(笑)。

手持ちの4TBのHDD二枚に、新規でHGSTのエンタプライズクラス4TBモデルを2枚購入し、不安要素の残るSeagateをすべて取り替えるついでに、3TB✕4枚のRAID-Z1を4TB✕4枚にアップグレードしました。これでNAS四号機がめでたく4TB✕8枚という構成になりました(4枚ずつRAID-Z1組んで分割して運用していますが)。

変更前(RAID-Z1)
①HGSTの3TBのやつ
②Seagate ST3000DM001
③Seagate ST3000DM001
④Seagate ST3000DM001

変更後(RAID-Z1)
①HGST 4TB 7200RPM HUS726040ALE610
②HGST 4TB 7200RPM HUS726040ALE610
③WD RED 4TB WD40EFRX
④WD RED 4TB WD40EFRX

HGST✕2枚、WD✕2枚ずつRAID-Z1組んで、いい感じにバラけたのではありませんでしょうか。欠陥品リスクもこれである程度抑えられるといいですね。

同じ製品ばかり使っていると、Seagateみたいな欠陥製品のリスクが増大します。しかし大量発注しないとコストが下がりません。システム屋の方は、常にこのようなジレンマと対峙しているのではないでしょうか(笑)。
(Seagateディスり過ぎたかなwwwブーメランにならなければ良いのですが…)

FreeNAS Corral (FreeNAS 10)宣告死亡

FreeNAS是由iXsystems开发的,基于FreeBSD Unix的64位开源NAS(网络附加存储)操作系统,基于BSD许可证发布,支持ZFS文件系统,具有iSCSI、软RAID、数据加密等功能,同时具备iTunes服务器、DAAP服务器、苹果Time Machine等功能,通过安装插件可作为媒体服务器(DLNA)运用。

FreeNAS最初起步于2005年10月,历经分家(先后分支出基于Debian的OpenMediaVault和同样基于FreeBSD的NAS4Free等系统)、开发人员离职等,于2017年3月发布了基于FreeBSD 10.3 RC3的FreeNAS 9.10。FreeNAS 9系列经历多年开发和改进,具有存储服务器所需的较高的性能和稳定性,为喜爱DIY的极客用户群和部分商业用户、研究机关所采用。同时,iXsystems还分别面向个人和商业用户推出了硬件解决方案和技术支持服务。

但是,由于FreeNAS 9系列年代较为久远,用户界面风格还停留在较为原始的风格,对于虚拟化的支持也不够理想。因此,作为下一代FreeNAS版本FreeNAS 10,iXsystems加入了原生CLI,使用HTML5等最新技术重写了WEB UI,并通过加入系统中间层(Middleware Agent)极大增强了系统的可扩展性和柔软性,同时宣布支持Docker Container和bhyve。FreeNAS 10的Alpha版本最早发布于2015年10月,后正式命名为FreeNAS Corral,并于计划于2017年3月正式发布。

然而,FreeNAS Corral也并非全是优点。不仅系统占用空间大幅增加,随着功能的增多,系统在一些较旧的硬件上的性能出现下降。此外,很多用户在从9升级到(官方说法是“迁移[migration]”而非“升级[upgrade]”)10升级后系统欠缺稳定性,各种bug频发。如卷、共享、服务的设定遭到重置,WEB UI无法保存设置,Update Train默认被设定在Nightlies频道,LAGG出现问题,浏览器兼容性出现问题(主要是Mac)。UEFI引导安装程序进行全新安装时在部分环境下出现兼容问题。此外,jails、SMB和iSCSI等功能缺失是最严重的短板。因此,几乎半数用户迁移到Corral后都选择了回滚到9(官方说法)。

面对这种情况,iXsystems于2017年4月12日发布声明,在关闭9.x到Corral的升级通道的同时,停止Corral下载,并将Corral的地位从Release(发布版)降格为Technology Preview(技术预览版)。不过,声明同时表示Corral的部分特性和新技术于5月份以FreeNAS 9.10.3更新的形式提供给现有用户,包括全新的WEB UI、FreeBSD 11-stable(提供Kaby Lake系列CPU支持)和Docker支持。

不过,从Corral的品质和完成度来看,我个人不得不怀疑9.10.3能否成为一个稳定的版本,在生产环境中导入9.10.3风险还比较大,对于比较敏感的服务,建议先观察一段时间再进行升级。

根据官方的说法,造成这种局面的背景之一,是Corral UI采用了MontageJS框架。由于Montage Studio开发组在Corral开发过程中解散,造成MontageJS框架进度落后,导致了部分浏览器兼容问题的产生。

然而,这种说明不能解释Corral项目品质整体的问题。不知道iXsystems内部究竟出现了什么问题、能否在短期内重整旗鼓完成9.10.3。

记第二次WD红盘返修

上一篇文章里讲了一次WD红盘返修的经历。

其实我手头还有一块坏了(=NAS报警SMART指标异常)的WD红盘,本来放弃治疗了,结果上次返修的经历意外的顺利,遂决定把这块坏了的硬盘也修了。

这次倒是比较幸运,电脑顺利地识别了这块硬盘,尝试格式化,正常,但是在尝试拷贝数据的时候出现了问题。每当拷贝一段时间之后,硬盘就会出现“咯叽、咯叽”的异响。异响是硬盘故障最常见、直接的症状。为了留下证据,直接上机用WD官方工具扫描,结果如下:

结果还没轮到我扫完全扫描,刚到快速扫描的地方就失败了(扫没一会就“咯叽”然后就停掉了,又等了一会,扫描就超时了)。

然后又用DG扫了一下,也是没扫一会就出来一大堆红。

    

(WD官方扫描工具是保修时的重要证据。只要这块硬盘主板还识别,就应该用这个扫,扫出FAIL就截图,如果客服要求出示证据,可以把截图提供给他们。)

然后12月13日我直接把这块硬盘又寄给了北京城市快车(事先没给他们打电话)。

12月14日顺丰显示北京城市快车已签收。跟上次一样,还是隔了一天12月15日,接到北京城市快车的确认电话,对方直接问“上次拿块硬盘没修好是吗?”,看来他们已经记住我了。我比较诚实回答说,这是另一块硬盘,然后和上次一样交了运费。其实,貌似如果没修好,或者返回的硬盘一个月之内再次出现故障,可以免运费继续修,只不过我觉着没必要为这点小便宜去冒出问题的风险就是了。

2016年最后一天12月31日中午,收到了城市快车寄回的返修WD红一块。这次从坏盘几处到收到返修盘共耗时17天,比上次长了2~3天,姑且算作误差好了。

第一批买的四台WD红盘中3台已经被NAS报警后换下(除了返修这两块,还有一块一样的WD 4T红盘检测软件完整扫描后报告OK,但还也不敢用了,只好束之高阁)。

(2017年1月6日更新)

扫描了一下,结论是没有坏块。姑且先用着吧……

记一次WD红盘返修

今年6月的一天,下班回家后发现NAS报警了。急忙打开NAS的控制面板一看,发现RAID5里的一块西数4T红盘offline了。为了避免事态扩大,急忙NAS关机后上jd订了一块新WD红。

坏掉的WD 4T红

第二天新WD红顺利到货,上机,RAID重建花了将近50个小时,总算太平了。

换下来的这块WD红插到电脑上看看什么状况,发现BIOS都不认。放着也是可惜,上西数官网查了一下序列号,竟然还在保(貌似到2017年),虽然早就知道返修这种事儿很是不靠谱,当死马当活马医决定返修。 继续阅读记一次WD红盘返修