WatchDog для нескольких десятков компьютеров.

Тема в разделе "Закажу проект", создана пользователем Feomothar, 7 ноя 2017.

Метки:
  1. rkit

    rkit Гуру

  2. Arkad_snz

    Arkad_snz Гик

    Решите сначала задачу в принципе - стратегически:
    1. Как ставится диагноз "клиент мертв" - удаленным опросом, подсаженным агентом, и по каким критериям?
    2. Как проводить реанимацию - оператор-надсмотрщик со своего насеста длинным шестом нажимает ресет или обезточивает все здание, и включает обратно?
    Потом можно обсудить конструкцию шеста.
     
  3. Feomothar

    Feomothar Нуб

    Уважаемый, Вы самый первый пост мой читали? Я изначально указал, что "Клиент для ПК читает конфиг из файла с номером ПК и адресом контроллера и раз в 10 секунд отправляет на контроллер по локальной сети пакет а-ля "я ПК номер 32, жив здоров"".
    Какой пинг??? Дальше прочитайте, там все написано, в каком случае производится реанимация. И эта цепочка она включает в себя абсолютно все возможные неполадки... проблема с сетевой картой - ребут, зависон - ребут, просто погас комп - ребут. по восстановлению питания комп сам не включился - запуск.
    Проблема вот тока с длинными проводами, проложу экранированной FTP, и заземлю со стороны контроллера. Но опять-же в готовом решении продают в комплекте максимум 7м провода, и с ними все работает на отлично. Компьютеры стоят друг к другу вплотную в одном помещении в 35 квадратов, если в середине комнаты поставить чудо коробочку, я смогу и 5 метровыми проводами обойтись.
     
  4. smart_pic

    smart_pic Нерд

    если пойти путем расширения портов через преобразователи параллельного кода в последовательный и последовательного в параллельный - сократить время на разработку и производство не получится. Так как трудозатраты практически одни и те же. Снизить стоимость сильно также не получится так как цена процессора практически будет равна стоимости регистров . Это все справедливо для вашего конкретного случая. Для производства ЕДИНИЧНОГО нужного вам девайса стоимость определяется стоимостью разработки , и не особо зависит от выбранной базы.
    А вот при серийном производстве другой расклад. Там важна стоимость комплектующих , если партия более 500 шт подобных устройств. Но если вы потом будете продавать сей девайс, то масштабируемая система будет выгодно отличаться ценой.
     
  5. Feomothar

    Feomothar Нуб

    1. Подсаженным агентом
    2. Длинным шестом удерживает питание 5 секунд на конкретно отвалившемся ПК и включает обратно.
     
  6. brokly

    brokly Гик

    Ну тут имеется в виду , что ардуино по сети пинает некоторое количество компов по некоему списку IP адресов. Если какой то комп в течении какого то времени не отвечает на пинги, то следует его перегрузить, ткнув в ресет (реализуется через оптопару, однако при монтаже придется обращать внимание на полярность, есть варианты и без полярного управления). Далее если этот комп опять, через некоторое время, не ответил на пинги, следует ткнуть в питание, причем нет никакого смысла контролировать мигание светодиода, просто нужно четко выяснить продолжительность "тыка". Далее логика по вкусу. Тут понадобится определение времени операции перегрузки компутера, времени допустимой задержки ответа на пинги, продолжительность тычка в кнопку питания, продолжительность тычка в кнопку ресета. Логика элементарная, но реализация веб интерфейса потребует трудозатрат. Можно вообще придумать исполнительные модули, каждый из которых имеет свой IP, устанавливается в свой шкаф и по командам головного устройства тыркает в ресет и повер.

    Кстати, как показывает практика проверка живости компа по ответам на пинг - не имеет права на жизнь. Намного правильнее запустить на каждом компе своего демона или системную службу, которые будут сами отчитываться перед устройством о своей работоспособности. Перестали присылать телеграммы - ткнуть кнопку.

    Но код к этому комплексу, наверное и будет стоить от 30000 минимум, а еще нужны опопары проводочки, разъемчики, припаять ... Мне кажется имеет смысл купить готовое.
     
  7. Feomothar

    Feomothar Нуб

    Вы знаете, я сейчас обсужу с коллегами вариант с продажей этого устройства в дальнейшем, и вполне возможно, что будет иметь место быть и такой вариант развития событий.
     
  8. ostrov

    ostrov Гуру

    Реле на питание (твердотельное нормальнозамкнутое) и никакого контроля светодиода не нужно. Экономия на проводах, пинах и трудозатратах.
     
  9. Feomothar

    Feomothar Нуб

    Кстати Вы очень интересно подметили насчет полярности подключения. При подключении прибора указанного выше имелась изначально проблема, не обратил внимание на полярность кнопки питания, думая что она там не имеет значения, однако ошибался, работает схема только при соблюдении полярности.
     
  10. brokly

    brokly Гик

    А че тут подмечать :) Я таких систем столько видал, мама не горюй :) C кнопкой питания проблем, как правило больше, чем с ресетом.
     
  11. Feomothar

    Feomothar Нуб

    Да, согласен, конструкцию это удешевит, и имеет это предложение рациональное зерно.
     
  12. Green

    Green Гик

    А почему Вы не рассматриваете автономный вариант? Статистику можно наблюдать и на высоком уровне (ПК - эзернет). Ребутом же займётся контроллер в корпусе ПК. Минимум - минимор. Вообще никаких соплей!
     
  13. Feomothar

    Feomothar Нуб

    Как я уже и писал выше, на современных платах, там поголовно используются Asus z270-a и Asus z270-p - проблемы с кнопкой ресет, периодически она не реагирует вовсе. а вот удержание кнопки питания - всегда.
     
  14. Feomothar

    Feomothar Нуб

    Цена вопроса интересует. Вариант рассматривается. Готовое решение https://shop.open-dev.ru/product/usb-watchdog-pro2 считаю чутка дороговатым. Не вижу там ничего, стоящего 20$
     
  15. brokly

    brokly Гик

    А там и нет ничего, с обратной стороны микропроцессор с USB интерфейсом. При учете, что в комплекте с этой платой еще идет драйвер(а) и ПО для настройки, вполне реальная цена. Я бы сказал без спекуляций.
     
  16. Arkad_snz

    Arkad_snz Гик

    Хорошо. С диагностикой определились: программный агент (клиент для ПК) регулярно докладывает контроллеру состояние ПК.
    Кто принимает решение о реанимации - контроллер, или агент?
    Кто бы это ни был логично пропустить решение через агента - м.б. предупредить пользователя "спасай, что можно".
    А если агент владеет инфой о предстоящей реанимации, то логично ему поручить управлять реаниматором.
    Посадить в ПК карту расширения и агент даст ей команду на ресет.. Проблема длинных проводов отсохнет сама собой.
    Кстати о контроллере - вы, я так понимаю, представляете его в виде автономного МК, подключенного к ЛВС?
    А почему бы не назначить контроллером ПК оператора в той же ЛВС, программно принимающий доклады от ПК, и отдающий команду на реанимацию
     
  17. DIYMan

    DIYMan Guest

    Мне, конечно, фиолетово, но чистой воды жлобство - кататься на мерсе и экономить на спичках. Я про то, что комп стоит далеко за несколько сотен $, а 20$ потратить на комп, чтобы купить готовое устройство и не парить людям моск - это дорого. Конечно - кто будет считать время на разработку, на написание ПО, отладку?

    Это я к чему? Имхо, опять же - денег тут нет, выдоят как последнюю полудохлую корову, за три копейки ;)
     
  18. Feomothar

    Feomothar Нуб

    Компьютеры - майнинговые фермы, никому ничего докладывать не нужно, что-то не так - перезагрузил и все отлично. Если компьютер завис - агент уже никакого решения не примет.
     
  19. man9913

    man9913 Гик

    ТС а что, часто виснут?
     
  20. DIYMan

    DIYMan Guest

    О как я угадал то про жлобство :)