Глупавите неща които причиняваме на компютрите си

В едно от компютърните списания които чета тия дни имаше тема за най-глупавите неща правени от компютърните специалисти на техните лаптопи и настолни компютри. Четейки признанията на авторите на списанието се замислих какви са моите прегрешения по темата. Не успях да се сетя за много. Истината е че дълго време нямах собствен компютър и когато най-сетне се сдобих с такъв се стараех да си го пазя много. Може би затова успявам дълго време да избегна проклятието на разлятата чаша кафе върху клавиатурата или не дай си боже – върху самия компютър. Сигурно фактът че не пия кафе също оказва влияние. Все пак и аз не съм безгрешен и бих допринесъл достатъчно материал за не една и две статии в списание. Откъде да започна… мдааа. Нека да е от моята сисадминиска кариера.

По времето когато преподавах в Академията се наложи да инсталирам уеб и пощенски сървър. Въоръжен с много ентусиазъм и малко знания направих една инсталация на Линукс и потроших няколко дни да я настройвам за нашите нужди придобивайки в процеса малко повече знания и губейки голяма част от ентусиазма. За историята е важно да се отбележи избора ми на файлова система – воден от изследователския си нюх и подкован със статистики и мнения от форуми, заложих на сравнително новата и революционна за времето си ReiserFS (версия 3). Дотук лошо няма. Сървъра си работеше перфектно, и няколко дни се разхождах със приповдигнатото самочувствие на врял и кипял админ. За съжаление един ден реших да оптимизирам още малко нещата и след като няколко процеса забиха взех че рестартирах сървъра. След рестарта бях топло посрещнат от съобщението, че на диска няма разпозната файлова система. Има едно особено състояние на духа, което предизвика съвсем осезаемо физическо усещане на обливане със студена пот. В този момент имах удоволствието да изпитам това състояние в цялата му прелест. След това го изпитах още веднъж при осмислянето на факта, че не бях направил нито едно архивно копие след инсталацията. Последващите няколко часа бяха прекарани в разкачване на дискове, закачването им на друга машина и пускането на проверка на файловата система. В края на упражнението имах почти цялата система възстановена. Почти. Бърза проверка показа че всичките файлове са намерени… по-точно всичките 117 000 (словом: сто и седемнадесет хиляди) разпокъсани парченца от файловете. Мърфи се беше пресегнал през временно-пространствения континиум и стовари закона си с цялата си мощ върху нашият беден сървър в секундата когато съм натискал бутона за захранването. Рестарта съвпаднал точно с момента, когато дървото на файловата система се е балансирало водейки до загубата на индекса на файловете и директориите. Така че информацията все още си беше на диска, само че файловата система не знаеше къде да ги намери. В тази фаза студеното изпотяване вече ми се струваше нормално състояние. Но какво са 117 000 парчета от файлове за Истинския Администратор ™. След подробно търсене из парченцата успях да намеря части от текстовата конфигурация на повечето услуги и след още няколко дни (вече имах опит) сървъра беше онлайн отново. Този път направих архивно копие. Както и месец след това. И на всеки два месеца след тази случка. Не че се наложи да ги ползвам.

От втората ми проява на изключителна глупост в най-неподходящ момент си изпати Stoma. В живота на всеки един кандидат инженер идва момент в който трябва да се изправи пред комисия за защита на дипломна работа. В случая на Stoma тази дипломна работа включваше реализацията на клъстер от няколко разнородни машини. Като новоизпечен инженер дипломирал се няколко месеца по-рано, естествено горях от желание да изявя своите способности и предложих помощта си. Беше ранен следобед когато настроихме машините и Stoma приключваше последните приготвления за тестовете. Все още неудовлетворен че не съм успял да демонстрирам най-доброто от себе си се лог-нах в компютъра на Stoma и в изблик на ентусиазъм пуснах обновяване на операционната система (Линукс естествено, какво друго може да се ползва за клъстери!). Излязоха разни въпроси на които естествено отговорих с “Yes” без даже да ги чета като един истински инженер. (Истинският Инженер ™ не чете съобщения – той винаги знае какво прави). Мярнах някакъв ред за премахвани пакети, обаче така и на разбрах какво става докато не чух някакъв стон откъм бюрото на Stoma. Бърз поглед към монитора му и забелязах как прозорците на приложенията един по един се затварят точно като на филм. Stoma имаше изражението на корабокрушенец, който току що е видял спасителния кораб да се отдалечава към хоризонта. Секунда по-късно се обърна към мен с един такъв леко плашещ поглед, че набързо се отказах да давам каквито и да било идеи. Към три и половина сутринта успяхме да възстановим щетите. Аз се прибрах към пет а защитата беше в осем. Няма нужда да споменавам че Stoma се справи блестящо. Само че се съмнявам дали ще ми повери друга машина за настройване.

Историята познава още много случаи на проява на глупост от моя страна, но стига толкова хвалби за един постинг.

8 thoughts on “Глупавите неща които причиняваме на компютрите си

  1. Няма да споменавам имена на участващи, но само ще добавя следната история дет се случи преди доста време, в духа на твоите прекрасни спомени. Не мисля че съм ти я разказвал досега. И между другото, Толли, дори и сега бих ти поверил сървъри, коли, деца и много други неща 🙂

    Та, въпросните двама участници правят ъпгрейд на един сървър, който се намира в co-location центъра на БТК в София. Става дума за фирма, която е нещо като начинаещ VoIP оператор, действието се случва в събота срещу неделя, някъде към 3 през нощта, когато няма клиенти използващи услугата, а участниците влизат в системата от офис в Пловдив…

    Единия рутинно прави някаква промяна в конфигурацията на едно Cisco (май беше C2924XL), но като “стар” networker не пише целите команди, а съкращенията. Иска да напише “show” нещо си, но пише “sh” и се сеща че трябва да направи нещо друго и по навик натиска Enter, щото е по-лесно да ти даде съобщение за грешка, отколкото да натискаш Ctrl-U и да пишеш отначало. Ама за съжаление промпта изглежда така:
    DIST-SF-INC(config-if)# sh
    Разбира се това е промпта за конфигуриране на интерфейс и в случая това е VLAN1 интерфейса, на който е IP адреса за отдалечен достъп. Достъпа до switch-а отказан 🙂 Опааа! На лицето се сменят сички цветове на дъгата след като нашите хора разбират какво са направили. В неделя сутрин ще почнат да влизат клиенти и … Общо взето следват много, ама много лоши неща. Първа идея: крадем кола, палим я и към София. Нищо че никой от тях нема книжка. Добре, ама в co-location-а точно в неделя няма пускане, щото нашите хора нямат пропуск – пропуска е в шефа, който точно в тоя момента е в Гърция. А, и ключовете за раковете са в него. Подробност. Малка.
    Както и да е, няма да разказвам кви емоции бушуваха в момента, само ще кажа че като се поуспокоиха нашите хора и този дето не пишеше “sh” където падне се сети за една малка вратичка – достъп до другаря UPS. Смелия ни герой влезе в UPS-а и рестартира switch-а, чието захранване беше вързано (разбира се) директно към UPS-а, без да се ползва RPS, и всичко беше прекрасно и мира във вселената възтържествува! Това е 🙂

  2. Съгласен съм че в някои ситуации Midnight Restart™ спасява “животя”. Не човешки, а на разни админи по света и у нас 🙂

    Често обаче е вредно и опасно, особено “Midnight червен телефон” кат почне да звъни, след като “Midnight Restart™” е дропнал услугите на около 15-ина хиляди потребители и билинга е зациклил и последните CDR не са се обновили и разни хора са говорили без пари (ПРИМЕРНО).

    НО (голямо НО), Midnight Restart върши чудесна работа в един много, ама много голям телеком, където повечето услуги се търкалят на неща от рода на Solaris 6 и Alcatel/Ericsson-ските системи са бетон, обаче софта е писан от начинаещи програмисти в Bangalore, които са имали крайни срокове за покриване и са правили сичко по рецептата “абе тва ще го оправяме после™”.

    Между третото, има много лесно решение на описания по-горе проблем – auto reload. Много е добре за автоматичен bail-out механизъм, ако нещо се прецака. Примерно, даваш си 5 минути да пуснеш/конфигурираш нещо и ако не работи като по учебник, правиш:

    # reload in 5

    и ако сичко е по мед/лютеница, масло и/или сирене (по рецепта на жена ми):
    # reload cancel

    Ако всичко се е омазало, reload ще спаси положението (ЕВЕНТУАЛНО).

  3. @deflax: Както stoma вече отбеляза сигурно ще си промениш мнението, ако въпросния cron има повече от един ред.

  4. @stoma: Хихи. Отне ми малко време да се сетя как се разширява “sh” в режим на конфигуриране на интерфейса. За тези като мен които още не са загряли вместо “show”, командата се разширява до “shutdown”. С една дума двамата безименни участници са си отрязали клона на който са стоели.

  5. Stoma, явно някой пипа по Матрицата защото току що имах дежа вю. Струва ми се че и аз не съм ти разказал тази случка.

    Отново имена няма да се споменават, а историята този път се развива в голяма европейска столица. Единия от участниците, по каприз на съдбата, прилича много на героя от предишната история на Stoma (онзи дето не е писал каквото не трябва където не трябва). Действието се случва отново в co-location и отново оборудването е на VoIP оператор.

    Двамата герои правят смяна на маршрутните таблици. Този, който претендира да е специалиста по мрежи, се логва в firewall-а и като прилежен администратор прави обновяване на пакетите на операционната система (казах ви че звучи познато!). Само че от последното обновяване има някои промени по ядрото и glibc което води до това, че единия интерфейс отказва да маршрутизира трафик. Последващия опит да се премахне драйвера на мрежовия интерфейс и последния да се рестартира довеждат firewall-а до 100% натоварване на процесора и “замръзване” на конзолата. Учудващото е че продължава да маршрутизира трафик по останалите мрежови интерфейси. Нашият специалист се чеше там където не го сърби и решава да рестартира цялата машина, само че има клиенти закачени по линиите и се налага да се изчакат … до 3 сутринта. Героите се прибират, пият по една студена вода и един горещ чай и се връщат обратно в co-location-а само за да установят че охраната е заспала в някой скатан ъгъл. След половин часово звънене по телефони най-накрая успяват да влязат, рестартират firewall-а и някъде към 6 сутринта да приключат.

    Ей така двадесет минутните промени отнемат по една вечер.

  6. Мда – мога да кажа, че наистина историиките са доста интересни и може “болезнени” за някои участници. Само мога да потвърдя че още ми се спи след двадесетина минути промени :), но все пак как по друг начин ще видиш изгрева в голямата европейска столица.

  7. Хихихи, колко познато 🙂

    Между третото, не сме само ние дет причиняваме тия неща на компутрите си. И трети лица (или гъзове – излишното да се зачертае) също извършват разни разнообразни. Например, снощи миризлиндоуз ма помоли да сложи сървис пак и аз викам “що ли да не пробваме”. Прочетох коментари, стандартните release notes и прочее – оказа се че прави –ГОЛЯМА- каша и си викам – “Тъкмо кат за мен!” и си го инсталирах. Оставих да се рестартира и легнах да къртя. На сутринта, разбира се, няма звук. НЕМА ЗВУК! А тъкмо съм на супер интересна мисия на Command & Conquer и без звука не е яко. И така. Сега го оправих, ама ми отне ценно време, което трябваше да е посветено на спасяване на света!

    От трета стана, обичам майкрософт, щото без тях нашата професия почти щеше да е на изчезване. Тъй де, ако всички софтуерни компании правеха лесен и достъпен софтуер, който е надежден, сигурен и прочее… нямаше да има много място за нас, нали?

    ГОЛЯМО БЛАГОДАРЯ, МАЙКРОСОФТ!

    А пък линукс – тъй като сами си го правим, го правим такъв, че нормални потребители дори да не могат да припарят 🙂 хи хи хи хи

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.