Шура ([info]shura_o) wrote,
@ 2009-03-15 19:01:00
Previous Entry  Add to memories!  Share this!  Next Entry
ИНТЕРПРЕССКОН-2009
Друзья!
Наконец-то появилась достаточно полная информация об условиях участия в ИПК-2009. Смотреть нужно на сайте http://interpresscon.ru.
Скоро заработает форма для заявок на оф. сайте ИПК, но уже можно подавать заявки непосредственно на емейл оргкомитета 2009@interpresscon.ru. Короче, на сайте все подробно изложено. Пожалуйста, не поленитесь ознакомиться :)
Если не трудно, расскажите всем-всем-всем, что пора записываться на ИПК :)

Спасибо!



(16 comments) - (Post a new comment)


[info]don_ald
2009-03-15 04:44 pm UTC (link)
Тебе спасибо, очень постараюсь вписаться.

(Reply to this)

Шура, привет!
[info]lleo.aha.ru
2009-05-06 04:20 pm UTC (link)
Можно тебе вопрос задать, как крупному специалисту по винчестерам?

Я просто тут на днях включил SMART и до сих пор нахожусь в некотором шоке: он показывает на моих винтах Seagate Barracuda (мне кажется, это ключевое) миллиарды ошибок чтения и позиционирования. Но при этом винты вроде работают (хотя один щелкает), и если бы я не включил СМАРТ, я бы наверно ничего не заметил.

Я не знаю, как интерпретировать эту информацию. Это нормально для любых Сегейтов, такое дикое число ошибок в статистике? Или я не на ту строчку статистики смотрю? На WD ошибок нет - ноль фактически. Краткая выжимка тут, в самом конце таблица: http://lleo.homeip.net:8081/ по названиям винтов кликабелен полный отчет СМАРТ.

(Reply to this) (Thread)

Привет, Лео!
[info]shura_o
2009-05-06 05:00 pm UTC (link)
Отвечаю тебе со слов твоего тезки, Лени Тарановского, одного из наших супер-мастеров :)
Да, для сигейтов это нормально - все вполне по-среднему, ничего там у тебя фатального нет; эта информация служебная и отображается именно сигейтами как-то по-другому, чем у всех :) Короче, пока особых опасений нет. Но, естественно, это все равно ничего не гарантирует :) то есть, не хуже, но и не лучше, чем было, и случиться с любым винтом может все что угодно в любой момент. Как говорит другой наш гуру, Миша, "винчестер - не место для хранения информации" :)
Что еще: один из них у тебя раз или два перегревался; насчет щелкающего - тщательно проверь разъемы питания и прикинь, не слабоват ли блок питания. У меня было такое, и мне пришлось, по совету Миши, апгрейдить БП, потому что два сигейта и двд он не потянул, а сигейты, в отличие, весьма чувствительны к качеству питания, вплоть до гибели контроллера :(
Вот в обещм все, что мы имеем сказать по твоим логам.

Рад был пообщаться хть так :) обращайся, если что :) подсобим.

(Reply to this) (Parent)(Thread)

Спасибо большое! И Лене спасибо огромное!
[info]lleo.aha.ru
2009-05-06 05:12 pm UTC (link)
Успокоил, уф... Это у меня, однако, именно место для хранения информации - там все, что нажито за последние 18 лет со времен Бк0010 ;)

Блок питания буду менять - он всего 300Вт, а у меня к нему подвешено много всего (помимо 3 винтов) на 12 вольт - монитор, дверной замок и вайфай-точка (не нашел отдельных источников).

Тогда можно последний вопрос?

Поскольку винчестеры важные - это домашний сервер, там все архивы - я хочу построить систему (онлайн-систему в личной админке, мне это легче написать самому), которая бы предупреждала, как только с ними начнет что-то происходить угрожающее.

Посоветуйте алгоритм: какие именно из параметров мне надо отслеживать для всех трех винтов, и какие значения для них критичны?


UPD: Сорри, самый последний вопрос: а вот такие ошибки в статистике критичны?
Error 32 occurred at disk power-on lifetime: 8 hours (0 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 07 d1 fd 1f e0  Error: UNC at LBA = 0x001ffdd1 = 2096593

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c4 00 08 d0 fd 1f e0 00      00:04:19.120  READ MULTIPLE
  c4 00 02 6a df 19 e0 00      00:04:19.099  READ MULTIPLE
  c4 00 02 66 df 19 e0 00      00:04:19.095  READ MULTIPLE
  c4 00 01 71 7c 1a e0 00      00:04:19.074  READ MULTIPLE
  c4 00 12 5f 7c 1a e0 00      00:04:19.054  READ MULTIPLE


Это уже мой личный винт на компе, он не так важен - все главное на сервере. Так что на этот вопрос можно не отвечать ;)

(Reply to this) (Parent)(Thread)

Re: Спасибо большое! И Лене спасибо огромное!
[info]shura_o
2009-05-06 06:05 pm UTC (link)
Леня, я уже с работы убегаю :) домой пора. С Леней я поговорил, все выяснил. До дому доберусь - напишу; информации на добрую главу :) так что подождать придется, я не так быстро, как ты, тексты ваяю :)
Зато после прочтения ты станешь практически специалистом :) ну, в теории вопроса уж точно.

(Reply to this) (Parent)

рассказка о смарте в двух частях - ч. 1
[info]shura_o
2009-05-06 09:58 pm UTC (link)
Так. Начинаем сто первую, самую страшную рассказку :)

вот такие ошибки в статистике критичны?

40 51 07 d1 fd 1f e0 Error: UNC at LBA = 0x001ffdd1 = 2096593

UNC - нечитаемый кластер, как-то так переводится. Вот это неприятно. Это т.н. ремаппинг (remap). То есть, нашелся сбойный сектор, который перенесен на другое место. Винты (их внутренний софт, в контроллере) устроены так, что логическая адресация c физической связаны через таблицу этого самого ремаппинга. То есть, sn обращаешься к, например, 2009-му сектору диска (логически, через систему), а в талице написано, что он сбойный и на самом деле находится по адресу э-э-э... 10000018. Все это потому, что дисков без сбойных секторов не бывает, и таблица частично заполнена еще на заводе... Для ремаппинга выделен специальный кусок диска (мы же можем ремапить только на незанятые сектора, не так ли?), и когда этот кусок кончается, диск начинает дохнуть. Об этом, кстати, смарт как раз может предупредить. Но это, к сож, почти единственое, о чем он может...
Есть еще нюансы, но об этом дальше.

Поскольку винчестеры важные - это домашний сервер, там все архивы - я хочу построить систему, которая бы предупреждала.
Посоветуйте алгоритм: какие именно из параметров мне надо отслеживать

Для начала, мнение твоего тезки - никакие :) Они, в общем-то, не предупредят практически ни о каких ситуациях, которые реально случаются. То есть, он бы, смарт, может, и хотел... но не может. Скажем, чаще всего эти (речь о твоих сигейтах) приходят с заклинившим шпинделем или с залипшими (а то и вывернутыми наизнанку, "домиком", головками - на этих картинках, на нашем сайте в фотогалере есть картинки), и уж об этом тебя смарт никак не предупредит, потому что это случается мгновенно, а /после/ этого винт умер, и смарт вместе с ним...
Клин происходит обычно либо из-за перегрева (масло испарилось из подшипника, а они гидравлические), стукнули (иногда хватает несильного толчка, ладошкой зацепил, на миллиметр - серьезно), ну и другие, уже неизвестные нам причины. Непредсказуемо в принципе. Головки липнут - ну, тут есть ряд предположений: во-первых, то же масло. Блины сигейтов покрыты специальным защитным слоем, над которым парят головки (аэродинамика); зазор - даже не микрон. Масло от тепла испарилось, запачкало головку, она раз - и прилипла. Покрытие этому, как оказалось, способствует :) А может, и от покрыти что-то при жаре отслаивается - кто знает... там ведь пылинка микронная на блине - как метровый булыжник под колесо твоему мобилю :(
Ну, этот вариант иногда даже удается просто отмыть - разобрали, промыли головки, работает (прадва, недолго; :) после таких операций винт уже к длительной эксплуатации непригоден). А вот если голова прилипла на лету - ее выворачивает. Тут уж пиздец так пиздец... она для начала борозду пропахивает (см. картинки), и этот кусок уже невосстановим в приципе (см. статью твоего тезки). Тут - по полной: донор, замена блока головок, и если повезет и покоцанная борозда легла удачно - что-то считается. А бывает, что неудачно... скажем, если полоса где-то псреди диска, то можно гловкам сказать, чтобы от нее держались подальше. А если она в таком месте, которое головам не миновать (подробности опустим), тогда новые головы об нее бац - и пиздец вернулся. На это раз окончательно...

(Reply to this) (Parent)

рассказка о смарте в двух частях - ч. 2
[info]shura_o
2009-05-06 10:04 pm UTC (link)


Короче, есть парочка хороших решений. Первое, бюджетное: пишешь дубль архива на винт и кладешь в сейф.
Тебе ведь вряд ли нужен ежедневно весь терабайт из этих двух винтов? Да что ж забило весь этот объем? я фотошопил, корелил, верстал и сканил лет двадцать - и при этом мой архив, ну, честно говоря, без полугода - ушло с винтом, что спижжен был ментом :) - влез меньше чем на 30 двд. 150 гигов. В двух экземплярах- пусть 300. Да хоть 500 - спасет от всех проблем. :)
Короче, два дополнительных винта в сейфе спасают. Святая истина неизбывна: бэкап, и еще раз бэкап. Желакельно в трех поколениях...


Второе - увы, дорогое: райд (RAID), полноценный. Ну, ты, наверное, знаешь. Единственно, надо покупать достаточно дорогой контроллер, который умеет следить за состоянием дисков и сообщать об их выходе из строя - хошь смской, хочешь - по емейлу. Чтоб уровня не ниже был, чем 5. Ну и не меньше трех к нему винтов...

К сожалению, и это решение не идеально, поскольку спасает только от физических неисправностей. :( скажем, зеркало тупо сдублирует логическую ошибку на второй экз. - и кирдык...

Софтовые райды - не. Как следить за их состоянием?


Ну вот. Примерно это мне сказал великий Леня (тезка твой, не ты :)
Теперь вернемся к твоему примеру - какие же параметры из смарта имеет смысл хотя бы посмотреть?

Названия копировать не буду, по номерам:

5 - перемещенные сектора. Ну, из вышесказанного понятно, да? Пока не исчерпался запас, жить можно. Но, кстати, тут есть еще один маленький нюанс (обещанный вначале): если ремап идет при записи в пустой сектор, все путем. А если при чтении - вот тут возможны неприятности. Скажем, читаешь ты файло. Диск определил, что сектор не читается никак - и заремапил его. Начинает он многократно его считывать - схема понятная - и если при каком-то проходе считывание удается, сектор ремапится с информацией вместе. Но если до достижения предела повторений (понятно, что они небесконечны) считать инфу корректно не удастся, то сектор переносится пустым... :( и файл твой получает, сука, дырку, в которой информации-то нет... и если это просто txt - говно вопрос, пропала пара строчек (хотя, сказать по правде, весь абзац). Ну, видео - пропали два-три кадра. А если что-то, что чувствительно к пробоям - такие файлы тоже ведь бывают - то может и всему такому файлу кирдык настать. Случалось, и нередко... :(

190, 194 - температура. Опять-таки, уже упоминал про перегрев, и что потом настанет...

187 - сбойные сектора. Те самые. Не буду повторяться :)

199 - эти ошибки обычно вызываются дефектами шлейфа. Винт не помрет, но стоит разобраться. Шлейф переткнуть, а лучше поменять.

197 - кандидаты на ремап. Смарт, он умный. На то и смарт :) И если он заметил ошибку чтения (одну, а может, две - от алгоритма все, как он реализован, зависит) - и такую вот месагу тебе пошлет. Нет, данные считались, вторым проходом, скажем, все путем:) Но галочку на всяк случай поставит, осадок-то остался. И когда ошибка повторится - тут уж, типа, не надо думать - был ты кандидат, а нынче полноценный сбойный сектор. Вперед, в ремап. И снова все путем :)

Вот так примерно. Я надеюсь, мой ответ тебе поможет. Излагал сумбурно я Ленины слова, но сделай скидку на время - скоро два, а я с работы... уж притомился. Да и то, рекорд - набрал за раз, считай, семь тысяч знаков! :) Ну, этим мне тебя не удивить - нет, не глава, и даже не рассказик :)

Пока, был рад с тобою пообщаться :) все, спаать... нет, все же ебну перед сном немножко пива :) после кона много еще не принимает организм :)))



(Reply to this) (Parent)(Thread)

уф... спасибо огромное!
[info]lleo.aha.ru
2009-05-07 12:09 am UTC (link)
Все запомнил, все записал.

Следилку за указанными тобой параметрами настроил: http://lleo.homeip.net:8081/

Странно, что не у всех есть параметр 187. Даже по последнему винту (это на моем личном который) - вроде ошибки в полной статистике он пишет, а по параметрам - все чисто. И даже smartctl -H выдает "PASSED", то есть полный порядок.

Ну ладно. Спасибо тебе, теперь я все знаю, и буду следить за чем могу. Ну а если голова наковырнется, как ты говоришь... ту уж понятно, не уследишь за таким.

Скажи... вот я понимаю, вопрос идиотски, но все-таки, по твоему опыту - если сегодня покупать винчестер в 1Тб, то какая фирма лучше? Hitachi? Seagate? WD? Samsung, прости господи? Ну, понятно, что не Seagate-Maxtor... :)

(Reply to this) (Parent)(Thread)

Re: уф... спасибо огромное!
[info]shura_o
2009-05-07 10:48 am UTC (link)
Ну, тут трудно сказать, конечно - ситуация ведь меняется ежедневно практически. Дело ведь в чем? Фирмачи, чтобы быстрее других выпустить новый винт, бОльшей, скажем, емкости, и оббрести конкурентное преимущество, часто довольно сырые модели пускают в тираж. Что, как известно, плохо может кончиться... но со временем все устаканивается, обычно. Поэтому я рекомендую брать диски, скажем так, предыдущего поколения - ну, не самые свежие модели и не самой высокой емкости, а те, что перед ними в линейке. Которые выпускаются хотя бы полгода, и кое-какие баги в них уже устранены. И при этом смотреть на дату выпуска - если диск прошлогодний, лучше поискать более свежий - разумеется, речь об одной и той же модели.
Учитывая, что уже вовсю пошли 2ТБ, терабайтник уже брать можно :))

Ну а опыт нашей фирмы пока говорит, что Самсунг.

PS. Ты картинки, кстати, посмотрел? А то я ссылки забыл проставить в посте. Они тут вот лежат: http://q-lab.ru/ru_photo_4.shtml

(Reply to this) (Parent)(Thread)

Re: уф... спасибо огромное!
[info]medvedd
2009-05-07 09:16 pm UTC (link)
Спасибо за ценные консультации! Особенно за параметр 199, буду теперь знать.

(Reply to this) (Parent)(Thread)

Re: уф... спасибо огромное!
[info]shura_o
2009-05-08 01:48 pm UTC (link)
Всегда пжалста :)) обращайтесь, если что. А если уж совсем "что", тоже обращайтесь - вот здесь все координаты: http://q-lab.ru .
Кстати, рекомендую просто почитать теоретитеский и раздел помощи - там много довольно интересных и полезных вещей рассказано, причем профессионалами :)

(Reply to this) (Parent)(Thread)

Re: уф... спасибо огромное!
[info]medvedd
2009-05-08 02:29 pm UTC (link)
Большое спасибо :)

(Reply to this) (Parent)

Re: уф... спасибо огромное!
[info]stas_pereverzev
2009-05-07 09:54 pm UTC (link)
Ну а опыт нашей фирмы пока говорит, что Самсунг.

С 2005 года, когда свой купил по хорошим отзывам, не испортился, стало быть. YESSS!

Hitachi - это IBM, коих у меня умерло два - сначала "дятел", потом "авер" - и, помимо кучи файлов, навсегда убило доверие к этой марке.

(Reply to this) (Parent)(Thread)

Re: уф... спасибо огромное!
[info]shura_o
2009-05-08 01:51 pm UTC (link)
А еще были фуджики : http://q-lab.ru/ru_photo_4.shtml#1 - прямой ссылки на картику, к сож. нету, там яваскриптом... но она посередине. Да там и другие весьма познавательные :)))

(Reply to this) (Parent)

Re: уф... спасибо огромное!
(Anonymous)
2009-05-10 08:49 am UTC (link)
Сигейт Барракуда на террабайт 11 серии лучше пока не брать. У меня один навернулся уже, а на их сайте признано, что эта серия косячная и выложены всякие там прошивки, но гарантируют ли они, что после смены микропрошивки всё будет хоккей - неизвестно. Так что я снес в гарантийку.

(Reply to this) (Parent)

(Reply from suspended user)

(16 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Log in with OpenID
English • Español • Deutsch • Русский…