Brodetskyi. Tech, VC, Startups


Channel's geo and language: Ukraine, Ukrainian
Category: Technologies


Tech, VC, Business, Startups, AI and more.
👤 linkedin.com/in/andrii-brodetskyi
✉️ @politehnik

Related channels  |  Similar channels

Channel's geo and language
Ukraine, Ukrainian
Statistics
Posts filter


🙅‍♂


📉 Ще один цікавий тренд в економіці AI - швидке зниження вартості інференсу, про що пише партнер a16z Guido Appenzeller. Ключове:

• За три роки середня вартість обробки мільйону токенів знизилась в 1000 разів.

• Наскільки LLM продовжать дешевшати, залежить від багатьох факторів, зокрема автор виділяє
Better cost/performance of the GPUs,
Model quantization
Software optimizations
Smaller models
Better instruction tuning
Open source

і приходить до висновку, що здешевшання продовжиться, хоча і не такими високими темпами.

• Інше цікаве питання - наскільки це проблема для бізнесу розробників LLM, адже їм треба якось заробляти. Зараз виглядає так, що вони фокусуються на монетизації своїх топових моделей. Але навіть так вартість інференсу топової моделі OpenAI (o1) така ж, як була при запуску GPT-3 ($60 за мільйон токенів).

• Для розробників AI-сервісів та користувачів це звісно позитивний тренд. Нинішні ціни на LLM API уможливлюють такі бізнес-моделі, які ще кілька років тому були нежиттєздатними. Якщо ви буде говорити 10 годин на день, все що ви наговорите за рік можна обробити за $2. Код ядра Linux - за $1. Додайте до цього так само низькі ціни на API text-to-speech сервісів, і виходить що простого голосового асистента можна розгорнути практично безкоштовно.


🚧 Окремо пишуть про те, що і Google зіткнувся з цією проблемою в своєму великому AI-проекті Gemini. Гіганту не допомогла перевага в доступі до великих обсягів даних та обчислювальних потужностей, на яку сподівались в компанії. Тренування на синтетичних даних теж не дало очікуваних покращень (з цим зіткнулись і OpenAI та інші розробники).

Раніше повідомлялось, що Google Gemini значно відстає у використанні від конкурентів з OpenAI та Anthropic.
He said it took 30 seconds to use OpenAI’s application programming interface the first time he tried it, compared to 4 hours with Gemini because Google required him to set up a cloud account and make a bunch of configurations

Чудова ілюстрація до дискусії про те, як стартапам конкурувати з великими корпораціями.


🧠 Ось і The Information про це пишуть: OpenAI Shifts Strategy as Rate of ‘GPT’ AI Improvements Slows

• Нова модель Orion показує нижчий приріст перфомансу відносно GPT-4, ніж GPT-4 відносно GPT-3. Одна з головних причин - для тренування уже використали практично всі доступні дані. Відповідно, фокус зміщується на покращення моделі після тренування, зокрема, те що називають "дати моделі подумати", як в o1 - коли модель генерує кілька варіантів відповідей, а потім їх оцінює і обирає чи синтезує кращий.

• Якраз тут очікується наступний значний приріст якості моделей, а не в масштабуванні. Чим довше модель має можливість "думати", тим краще вона справляється з задачами на reasoning, в даному випадку (графік) з розв'язанням задач з математичних олімпіад.

• Загалом прогрес в розвитку LLM не зупиняється, але розробники моделей змінюють підхід - від "зазубрювання" знань до розвитку "мислення" моделей. Це може дати дуже непоганий приріст продуктивності. Власне, уже зараз ви можете задати складне питання моделям GPT-4 і o1 і оцінити різницю в якості відповідей.


🏗 Свіжий request for startups від YC— список перспективних напрямів, над якими працюють занадто мало стартапів. Без AI та B2B SaaS — тут уже забагато і людей, і капіталу. Виробництво, інженерія, космос, фінтех.
• Government software
• Public safety technology
• Manufacture in the USA
• Stablecoins 2.0
• LLMs for chip design
• Fintech 2.0
• New space companies
• AI-aided engineering tools
• One million jobs 2.0

Останній пункт особливо цікавий:
We would like to fund startups that have a useful need to employ a million workers in a way that uniquely needs humans to do the job and there will be no structural need for the job to be done with AI

Зміни на ринку праці очевидні: багато професій частково автоматизуються, поріг входження зростає. Чим займати людей — цікаве і важливе питання. В першу чергу для урядів. Цікаво, що тут можуть зробити стартапи. На думку спадають хіба що якісь нові гіг-сервіси і діджиталізація офлайн-бізнесів. В крайньому випадку будемо всі збирати датасети для тренування наших хмарних богів AI.


🛑 The AI industry is moving beyond the "bigger is better" era, and the implications are fascinating

🧠 The traditional "scaling up" approach with more data and computing power is showing diminishing returns. Leading AI labs, including OpenAI, Anthropic, xAI, and Google DeepMind are pivoting towards "test-time compute" and inference optimization, shifting focus from raw model size to intelligent reasoning capabilities.

💭 Ilya Sutskever, co-founder of AI labs Safe Superintelligence (SSI) and OpenAI, told Reuters recently that results from scaling up pre-training - the phase of training an AI model that uses a vast amount of unlabeled data to understand language patterns and structures - have plateaued.
“The 2010s were the age of scaling, now we're back in the age of wonder and discovery once again. Everyone is looking for the next thing,” Sutskever said. “Scaling the right thing matters more now than ever.”


⌛ A striking example: giving an AI model 20 seconds to think achieved the same performance boost as scaling up training by 100,000x. This is transforming how we approach AI development.

⚙ This shift has major industry implications:

• Moving from massive training clusters to distributed inference
• Shift in hardware demands and infrastructure needs changing competitive dynamics in AI chips/infra market
• Growing importance of inference optimization and specialized training techniques
• Companies rethinking their AI development roadmaps

📈 Curious how that will change the pace of AI progress and impact financial markets. Or can NVIDIA stock only go up? We'll see.

👨‍💻 I have an optimistic view here. Regardless of the slowdown in LLM progress, even with the current state of technology fascinating products and companies are being built with tons of value created.


🔼🔽


📈 Number go up


⛵️

4.3k 0 39 7 132

🎯 Fascinating data from the 2024 election on prediction markets vs traditional polling.

The standout winner? Prediction markets, particularly Polymarket ($3.7B in election-related trades), which showed remarkable forecasting accuracy:
• Called Trump's victory at 95% confidence by 11:43 PM ET - nearly 6 hours before AP
• Correctly predicted outcomes in key swing states while polls showed tight races

📊 Key insight: While polls underestimated Trump by ~5 points even after adjustments, prediction markets proved more accurate at capturing real voter sentiment.

Interesting signals:
• Google Trends spotted a pattern 48 hours early: "where to vote" searches were significantly higher in red states (14 of top 15)
• Alternative data and market-based signals outperformed traditional polling methods

💭 The lesson? Market-based information aggregation could be more effective than traditional polling for predicting outcomes. This has huge implications for how we forecast major events.


📝 Ну і prompt engineering best practices від OpenAI та Anthropic теж варто проглянути (або послухати). Так би мовити, документація від виробника. Якщо хтось і розуміє магію LLM зсередини, то це власне їх розробники.


💡 Гарний пост про те, як ефективніше працювати з LLM. Постійно використовую 1, 3, 4 і 6 підхід, і особливо 7 (RAG) - в основному, тільки з додатковими документами і використовую Claude, там найбільше цінності. Елементарно, закинути туди кілька PDF з релевантними матеріалами (аналітика, звіти і тд), і вже зовсім інший результат отримуєш, ніж з plain vanilla LLM, як не викручуйся там з промтами.

Рекомендую!




💡 DOU зібрали рекомендації книг про AI від різних фахівців, від міністра цифрової трансформації до дата-саєнтистів та менеджерів tech компаній. Вийшов гарний список з різноманітними перспективами, від технічних до філософських. Я теж долучився з максимально прикладною рекомендацією.


Dating in tech

6.8k 0 32 3 149

The four horsemen of SaaS homepage


📈 Magnificent 7 vs. 2000s Tech Bubble: higher concentration, but healthier fundamentals


🤩

9.4k 2 57 10 187

This hits hard 🥲

9k 0 57 15 91

State of AI Report - 2024 ONLINE.pdf
36.6Mb
📍 Вийшов щорічний State of AI Report від Air Street Capital. Потужний звіт на 200+ сторінок. Можна за один вечір дізнатись все важливе про стан справ в індустрії. Рекомендую!

Тут огляд ключових тез на 14 хв від автора.

20 last posts shown.