Вот тебе практический пример.
Сайт браузерной онлайн игры.
Пики нагрузки ~9:00, между 13:00 - 14:00 и вечером с 19 до 20.
Всё остальное время загрузка почти минимальна, т.к. очень мало человек использует сервис.
Разница между пиками и простоем в 20-40 раз.
Если я куплю оборудование, которое сможет обработать пики загрузки, то оно будет простаивать 80% времени.Вот тут нам на помощь приходит Azure, Amazon и теперь Google: все данные записываются через API в Object Storage, имеется Cloud SQL и Cloud Load Balancer.
Создаётся маленький инстанс который обслуживает минимальную нагрузку, в котором указывается сколько будет его копий запускаться при росте хитов/заходов/нагрузки.
В моменты пиков нагрузки, инстансы сами запускаются, подключаются к расшаренному Object Storage, если надо к Cloud SQL, а балансировщик распределяет нагрузку между ними.
Пик нагрузки прощёл - интансы-клоны убиваются.
В итоге ты платишь только за то, что "скушал"/потребил: в простои платишь очень мало, в пик нагрузки больше.
И никакое планирование, звонки в батацентр друзьям, выделение "по быстрому" сервер, напряг админов "сделайте балансер срочно!" тут не работает.
Пользователь сосредотачивается только на разработке своего проекта.