recentpopularlog in

talks

« earlier   
Зарубежные новости [34] -- шатание устоев гражданской авиации: ardelfi
Совсем нехорошо восприняли авиакомпании и всякие регуляторы два подряд разбитых Боинга-737 МАХ. У Боинга получилось выделиться из серой массы унылых эпизодов человеческого фактора за рычагами -- машины были разбиты трудами программистов Боинга, что не замедлил соответственно наградить фондовый рынок. В своё оправдание Боинг написал чистосердечное признание с не очень-то убедительным раскаянием в содеянном.

Во всём этом, особенно в сроках создания "улучшения программы", подванивает духом аджайла. Есть подозрение что в команды разработки Боинга проникло новое поколение, на которое уже натыкались в НАСА (провал программы DART). К чести НАСА, взрослые люди тогда раскопали всё до дна, и в отчёте разорвали это самое новое поколение беспощадно, разве что дебилами открыто не назвали, хотя из текста это следовало недвусмысленно. И вот теперь это проявилось в гражданской авиации. Конечно, в Боинге будут казни и кровопролития -- начальство не простит своим рукожопам случившееся с репутацией и акциями компании под конец квартала, когда уже пишется квартальный отчёт. Однако есть сомнения что кровопролитий будет достаточно для удаления духа аджайла из компании -- вполне возможно что причиной катастроф назначат нечто узкоспецифическое, легко исправляемое и малопонятное, а не системную деградацию методов достижения и сохранения безопасности столь сложной техники. Ну и теперь лучше летать на Аирбасе, хотя у них тоже карма в зловонных пятнах c 2009 (утопленный рейс 447 Air France), и тоже формально из-за сенсоров, однако по сути из-за дефекта архитектуры системы управления.
...
Some people are calling the 737MAX tragedies a #software failure. Here's my response: It's not a software problem. It was an

* Economic problem that the 737 engines used too much fuel, so they decided to install more efficient engines with bigger fans and make the 737MAX.
— Trevor Sumner (@trevorsumner) March 16, 2019

This led to an

* Airframe problem. They wanted to use the 737 airframe for economic reasons, but needed more ground clearance with bigger engines.The 737 design can't be practically modified to have taller main landing gear. The solution was to mount them higher & more forward.
— Trevor Sumner (@trevorsumner) March 16, 2019

This led to an

* Aerodynamic problem. The airframe with the engines mounted differently did not have adequately stable handling at high AoA to be certifiable. Boeing decided to create the MCAS system to electronically correct for the aircraft's handling deficiencies.
— Trevor Sumner (@trevorsumner) March 16, 2019

During the course of developing the MCAS, there was a

* Systems engineering problem. Boeing wanted the simplest possible fix that fit their existing systems architecture, so that it required minimal engineering rework, and minimal new training for pilots and maintenance crews.
— Trevor Sumner (@trevorsumner) March 16, 2019

The easiest way to do this was to add some features to the existing Elevator Feel Shift system. Like the #EFS system, the #MCAS relies on non-redundant sensors to decide how much trim to add. Unlike the EFS system, MCAS can make huge nose down trim changes.
— Trevor Sumner (@trevorsumner) March 16, 2019

On both ill-fated flights, there was a:
* Sensor problem. The AoA vane on the 737MAX appears to not be very reliable and gave wildly wrong readings. On #LionAir, this was compounded by a
— Trevor Sumner (@trevorsumner) March 16, 2019

* Maintenance practices problem. The previous crew had experienced the same problem and didn't record the problem in the maintenance logbook. This was compounded by a:
— Trevor Sumner (@trevorsumner) March 16, 2019

* Pilot training problem. On LionAir, pilots were never even told about the MCAS, and by the time of the Ethiopian flight, there was an emergency AD issued, but no one had done sim training on this failure. This was compounded by an:
— Trevor Sumner (@trevorsumner) March 16, 2019

* Economic problem. Boeing sells an option package that includes an extra AoA vane, and an AoA disagree light, which lets pilots know that this problem was happening. Both 737MAXes that crashed were delivered without this option. No 737MAX with this option has ever crashed.
— Trevor Sumner (@trevorsumner) March 16, 2019

All of this was compounded by a:

* Pilot expertise problem. If the pilots had correctly and quickly identified the problem and run the stab trim runaway checklist, they would not have crashed.
— Trevor Sumner (@trevorsumner) March 16, 2019

Nowhere in here is there a software problem. The computers & software performed their jobs according to spec without error. The specification was just shitty. Now the quickest way for Boeing to solve this mess is to call up the software guys to come up with another band-aid.
— Trevor Sumner (@trevorsumner) March 16, 2019

I'm a software engineer, and we're sometimes called on to fix the deficiencies of mechanical or aero or electrical engineering, because the metal has already been cut or the molds have already been made or the chip has already been fabed, and so that problem can't be solved.
— Trevor Sumner (@trevorsumner) March 16, 2019

But the software can always be pushed to the update server or reflashed. When the software band-aid comes off in a 500mph wind, it's tempting to just blame the band-aid
aviation  safety  programming  talks 
yesterday by some_hren
Развёрнутый ответ на комментарий, а также немного о жизни провайдеров в РФ / Хабр
В этом разделе я попытаюсь рассказать «эволюцию» ядра сети типичного интернет-провайдера за последний десяток лет.
Десяток лет назад.

В те благословенные времена ядро провайдерской сети могло быть простым и надёжным, как пробка:
Её суть в том, что трафик пользователей в конечном итоге приходил в коммутацию уровня ядра — откуда шёл в BNG, откуда, как правило — обратно в коммутацию ядра, и далее «на выход» — через один или несколько border gateway's в интернет.

Подобная схема очень-очень легко резервируется как на L3 (динамической маршрутизацией), так и на L2 (MPLS).

Можно поставить N+1 чего угодно: серверов доступа, коммутаторов, бордеров — и так или иначе их зарезервировать для автоматического фэйловера.

Через несколько лет всем в России стало понятно, что так дальше жить нельзя: необходимо срочно защитить детей от тлетворного влияния сети.

Возникла необходимость срочно изыскивать способы фильтровать пользовательский трафик.
...
Год-два назад по слухам, практически у всех ФСБ стало требовать реальную установку оборудования СОРМ (ранее большая часть провайдеров обходилась согласованием с органами плана СОРМ — планом оперативных мероприятий на случай необходимости что-то где-то найти)

Помимо денег (не так, чтобы прямо уж совсем заоблачных, но всё же — миллионов), СОРМ у многих потребовал очередных манипуляций с сетью.

Итого: за десяток лет схема ядра среднего провайдера усложнилась в разы, а дополнительных точек отказа (как в виде оборудования, так и в виде единых коммутационных линий) — значительно прибавилось. Собственно, само по себе требование «видеть всё» подразумевает сведение этого «всего» в одну точку.

Думается мне, это вполне прозрачно можно экстраполировать на текущие инициативы по суверенизации рунета, его защите, стабилизации и улучшению :)

А впереди ещё Яровая.
russian  internet  provider  network  talks  censorship 
2 days ago by some_hren
Men Explain Things to Me - Guernica
Young women subsequently added the word “mansplaining” to the lexicon. Though I hasten to add that the essay makes it clear mansplaining is not a universal flaw of the gender, just the intersection between overconfidence and cluelessness where some portion of that gender gets stuck.
feminism  talks  society 
8 days ago by some_hren

Copy this bookmark:





to read