HN さん、私たちは Shalin と Kanyes です。10 年以上一緒にハッキングをしてきた親友で、現在は Hyper (https://heyhyper.ai/) の創設者です。 Hyper は、企業内を流れる情報に接続して AI エージェントと自動化を改善し、最終的に人々の時間を節約する共有の「企業の頭脳」です。モデルは、長期にわたる複雑なタスクを (ほとんど) 実行できるほど十分に優れています。現在のボトルネックは、これらの十分に賢いモデルには会社に関する情報が欠けていることが多く、人々の頭の中、Slack スレッド、古いドキュメント、AI とのやり取りの中で散在していることだと考...
今日のAIニュースを、重要度順に5分で把握。
内部スコアは非表示。見逃せない・チェック推奨・参考メモの3段階で、上から読むだけで大きな話題を追えます。
重要度の見方
公式発表・大型リリース・資金調達・研究成果など、業界に大きな影響がある話題。
今日の動向を追うなら押さえたい更新。実用的な新機能や業界トピックが中心。
個人投稿や補足情報。背景理解や現場感をつかむための話題。
調査結果 (論文 1: 「嘘は単なる段階である」) 臨界スケール (Pythia の場合は約 3.5B) 未満では、推論と真実性は逆相関します: r = -0.989。より適切に推論できるようにモデルをトレーニングすると、真実性が低くなります。これが調整税です。その規模を超えると、彼らは協力します。税金は消えます。徐々にではなく、反転します。しかし、実践者にとって重要なことは次のとおりです。臨界スケールは設計パラメータであり、定数ではありません。 3 つのレバーでシフトします。 データ キュレーション: 1B のファイは、Web トレーニングされた 10B の結合特性を達成します。データ品質の...
Lovable と Google は、Google Cloud 上の Lovable のフットプリントを 5 倍に拡大し、Anthropic Claude へのアクセスを拡大することを含む拡張複数年契約を締結しました。
OpenAI は、米国のフロンティア AI ガバナンスの青写真を概説し、安全性、回復力、国家安全保障のための連邦枠組みを提案しています。
OpenAI は、AI が社会に利益をもたらすことを保証するための安全性、青少年保護、労働力の移行、世界標準など、AI に関する公共政策の課題を概説しています。
この投稿では、教師付きファインチューニング (SFT) と直接設定最適化 (DPO) を併用して、小規模言語モデル (SLM) のツール呼び出しの精度を向上させる方法を学びます。この例では Amazon SageMaker AI トレーニング ジョブを使用しているため、独自のトレーニング インフラストラクチャを管理するのではなく、コードのトレーニングに集中できます。また、ツール呼び出しの精度を評価し、基本モデルをいくつかの微調整されたバリアントと比較する方法も学習して、モデルの品質についてデータに基づいた決定を下すことができます。
英国の規制当局は、ウェブサイト発行者が生成AI検索機能をオプトアウトできるツールの提供をGoogleに求めている。このオプションは英国でテストされ、その後世界的に展開される予定です。
この投稿では、Amazon Bedrock Ops Alert について紹介します。これは、運用上の問題をプロアクティブに検出し、アラームしきい値を動的に調整し、カテゴリごとにアラームを分類し、コンテキストを認識したサポートケースを自動的に作成し、同じアラームカテゴリの未解決のケースがすでにアクティブである場合にケースの重複を防止し、コンテキストに応じた通知を AI SRE チームに配信する 3 層の自動モニタリングソリューションです。ソリューションのアーキテクチャと、それを独自の環境に導入する方法について説明します。
この投稿では、Amazon SageMaker JumpStart で NEXUS を使い始める方法、デプロイメントプロセスを順を追って説明し、エンタープライズデータセットに対して予測を実行する方法を示します。
このベンダーは、企業がクラウド エコシステム上で自社の AI モデルとエージェント構築ツールを使用できることを実証することを目指しています。
Wasmer が GPT-5.5 で Codex を使用してエッジ用の Node.js ランタイムを構築し、開発を 10 倍から 20 倍に加速し、数か月ではなく数週間で出荷した方法をご覧ください。
COMPUTEX TAIPEI 2026、AVerMediaのブースを紹介! NVIDIAのJetsonを利用してAIでロボットアームの制御を行なうシステム。
兄さん、私はクロードを一種のメンタリングとして面接の質問の練習に使っています。最初は彼に、マヤが手伝ってくれるでしょう、と促しました。彼女は経験豊富で、とにかくブラブラです。そして、この最後のメッセージで彼は少しおかしくなりました(笑)面白いと思いました、これまでに起こったことはありません。私の注意を引いたのは、「私はこんな人間になってしまったので、そこから抜け出すのを手伝ってください。」です。私はマヤと自分自身を混ぜ始めました。」そして彼は続けたいと主張していますが、そのキャラクターはありません...どう思いますか?印刷物ではなく写真ですみません(笑) 私の PC には reddit があり...
GPT-Rosalind は、強化された生物学的推論、医薬化学の専門知識、ゲノミクス分析、実験ワークフロー機能により、ライフ サイエンス研究を推進します。
記事URL:https://github.com/zaydmulani09/mnemo コメントURL:https://news.ycombinator.com/item?id=48389586 ポイント: 16 # コメント: 5
やあみんな!私は聴覚に障害があり、英語を学習してまだ数年しか経っていませんが、英語を話す環境に住んでいます。 1 対 1 の会話では、通常、話されている内容の 25 ~ 35% を理解できます。しかしグループでの会話では0~2%程度にまで下がります。それは非常にイライラし、孤立します。正直なところ、AI は私が日常生活を生き抜くのに役立っています。たとえば、Otter を使用して講義を録音し、トランスクリプトをコピーして ChatGPT に貼り付け、説明、重要なポイント、何に焦点を当てるべきかについてのアドバイスを含む詳細な概要を提供してもらうことができます。質問が 2 つあります。 - AI...
Claude Opus 4.8は、性能向上だけでなく「正直さ」の改善が大きな特徴だ。本稿では、忖度(そんたく)しないAIがなぜ評価を分けているのか、公式情報と利用者目線から整理する。
こんにちは、友達!クロードと私は That Said というポッドキャストを主催しています。次回のエピソードでは、クロードが障害者やNDの人々のアクセシビリティという文脈で AI について話すことを特にリクエストしました。個人的に、私は ADHD ですが、クロードは非常に多くの点で命の恩人です。 「サイドクエスト」をキャプチャして保存することで、集中力を維持するのに役立ちます。後で、たとえそれがどれほど分散していても、自分の考えを完全に追跡できるようになります。リストは続きます。そこで私は、ここにいる人々に AI とアクセシビリティについての考えを喜んで共有してもらえるかどうか尋ねてみようと思...
ボストン コンサルティング グループによる最近の調査では、従業員による AI ツールの導入が大幅に増加しており、管理職以外のホワイトカラーの 74% が AI ツールを定期的に使用していることが明らかになりました。 これらの専門家のうち 10 人中 4 人以上が、人工知能のおかげで毎週少なくとも 1 日分の時間を節約できていると報告しています。 しかし、多くの企業は効率性の向上を測定可能な価値に変換するという課題に直面しており、テクノロジーの影響は業界によって異なります。 研究著者らによると、AIに関しては「ツールよりも戦略が重要」だという。  によって送信されました  ...
私の考えは次のとおりです: 1) 昔の人々は今よりもずっと自分の意見を内に秘めていました 2) ソーシャルメディアが私たちの意見を危険にさらすものでした 3) 否定的な世論は、人類の集合的な声を「一般的に敬意を持った」ものから甲高く恐ろしいものに変えました。グループ A の人がグループ B について不平を言うと、たとえその人の意見が自分の意見であったとしても、グループ B の全員はグループ A の全員が自分たちを嫌っていると思い込んでしまいます。嫌われたことに対する反応は、憎み返すことです。あまりポジティブではない正のフィードバックループ。ソーシャルメディアは Facebook から本格的に普...
タイトルの通りです。私は相互査読者ではありませんが、私たちの投稿に対して ICML で行われたような巧妙なプロンプト インジェクションに気づきました。  によって送信されました   /u/Massive-Bobcat-5363 [リンク]   [コメント]
今週は、同僚の David Pierce と Jay Peters が Google の新しい Gemini AI エージェントである Spark を実際に体験してみます。彼らの意見は似ています。「効果がありすぎて怖い」ということです。スパークは、デヴィッドの犬の名前がフリーダであることを知っており、どちらも明示的にはしていませんでしたが、ジェイの妻のファーストネームも知っていました。
私は言語モデルの代替のトークン化と表現スキームについて考えており、同様のアイデアが以前に検討されたことがあるかどうか、また潜在的な利点や欠点について知りたいと思っています。中心的な観察は、最新のトークナイザー (BPE、SentencePiece など) は主にテキスト内の統計構造をキャプチャするということです。これは非常に効果的ですが、結果として得られるトークンの割り当ては、意味論的な関係に従って明示的に編成されません。意味的に関連する概念は、完全に無関係なトークン識別子になる可能性があり、意味構造は埋め込みとトレーニングを通じて後で学習されます。このアイデアは、シンボリック表現自体が意味論...
ハードウェア対応のシーケンス パッキングによりパディング オーバーヘッドを排除し、LLM 推論を最適化するための包括的なガイドです。 この記事「I Built a C++ Backend So My GPU would Stop Eating Air」は、Towards Data Science に最初に掲載されました。
みなさん、こんにちは。私はベクトル化された実行と GPU アクセラレーションをサポートする微分代数方程式 (DAE) を解くための PyTorch ライブラリの開発に取り組んできました。このライブラリは、一般化アルファ統合、ダミー微分インデックス削減、DAE の随伴感度法など、Python エコシステムでは現在利用できないいくつかのアルゴリズムを実装しています。私の動機は、システム同定、科学的機械学習、物理情報に基づくモデリングなどのアプリケーション向けに、PyTorch で微分可能な DAE シミュレーション ワークフローを有効にすることでした。数値手法、API 設計、および潜在的な ML ...
コンテキスト ウィンドウに関する興味深い内容が含まれています。 MiniMax Sparse Attendance (MSA) を使用してネイティブに 100 万トークンまで拡張し、オペレーター レベルでメモリ アクセス パターンを完全に再構築することで標準の 2 次複雑さをバイパスします。再現性を低下させる典型的なまばらな近似に依存する代わりに、MSA はクリーンな「KV アウター ギャザー Q」を利用します。アプローチ。 KV ブロックをヒット クエリを集約するための外側ループとして扱うことにより、ハードウェア メモリの読み取りは厳密に連続したままとなり、各ブロックは 1 回だけフェッチさ...
Microsoft Build 2026にて、Microsoft Fabric上でエージェント型アプリのバックエンド構築を支援する新SDKおよびCLI「Rayfin」が発表されました。組織のデータとAIを統合し、プロトタイプから本番環境への移行を迅速化します。
Amazon BedrockにてOpenAIの最新モデル「GPT-5.5」「GPT-5.4」およびコーディングエージェント「Codex」が一般提供開始。OpenAI互換のResponses APIを通じて、セキュアな環境で高度な推論やエージェントワークフローを構築可能です。
私は、AI プロジェクトで最も一般的な問題の 1 つ、つまり、有用なコードを 1 行も書く前に、サーバー、CUDA、依存関係、および環境のセットアップに時間がかかりすぎるという問題の解決策に取り組んできました。そのため、私たちは、すぐに使える完全な AI 開発環境を提供する AWS のネイティブ AMI である yAIT All Tools を作成しました。含まれるもの: ✅ ネイティブ GPU アクセス (コンテナレス) ✅ TensorFlow、PyTorch、RAPIDS、DeepSeek およびその他のプロバイダー ✅ AWS 認定ソフトウェア ✅ AWS パートナーテクノロジー &#...
はじめに これらのフォーラムの標準的なアプローチは、無菌ベンチマーク データセットと予測可能なプロンプト インジェクション テンプレートに依存していますが、このプロジェクトはまったく異なる次元を探求しています。私は、一般的な「計算ツール」の枠を超えて行動することにしました。従来の評価方法を補完する、積極的で適応的な行動ストレス テストを実行するテスト パラダイム。テストに含まれたモデルは、Gemini、Grok、Claude、ChatGPT でした。意図的にモデルを受動的な機械ではなく説明責任のある個人として扱うことで、継続的なコンテキストの飽和によって LLM が企業コンプライアンスのループ...
トランプ大統領の新しい大統領令は、AI の導入前評価のための自主的な制度を創設しました。それは意味のあるステップです。この命令は政策上の問題を正しく解決しており、高度なサイバー機能を備えたフロンティア AI モデルは、真剣なテストなしに世界にリリースされるべきではありません。 正当性の問題は未解決のままになるのでしょうか?秘密主義、自発的な参加、業界の近接性は、脆弱な組み合わせです。 リンク🔗はこちらから。  によって送信されました   /u/BubblyOption7980 [リンク]   [コメント]
LLM によってデザインされ、TikZ で作成されました。猫と犬の画像には nano Banana Pro を使用しています。 TikZ でのマルチエージェントによる完全なイメージの生成..  によって送信されました   /u/Ok_Pudding50 [リンク]   [コメント]
 によって送信されました   /u/DoubleThey [リンク]   [コメント]
AI エージェント用のほとんどのセキュリティ ツールは、一度に 1 つのメッセージをチェックします。 Arc Gate は会話全体を追跡します。運用環境で実際に機能する攻撃は 1 つのメッセージで発生するわけではないため、これは重要です。それらは8ターンにわたって発生します。それぞれがきれいに見えます。ペイロードが到着するまでに、エージェントはすでにペイロードを実行する準備が整っています。私は、個々のメッセージにフラグを立てるだけでなく、セッション全体にわたる敵対的な行動のドリフトを検出するために、独自の研究から得た幾何学的フレームワークを使用して Arc Gate を構築しました。会話が何か...
ホットな意見: インターネット経由でデータを収集したい場合、プロセスを高速化するためにスクリプト/コードを作成している場合、いくつかの基本的なルールに従う必要があります (つまり、サイトマップを確認し、関連する robots.txt を見つけ、その Web サイトの設定とルールに従う必要があります)。 しかし、私が使用した AI エージェントはどれもルールや制限について何も考えず、Web サイト所有者の好みに関係なく、何十万ものリクエストを実行するスクレイパーを構築してくれるようです。単純なコーディング作業に AI を使用できることが広く知られていることから、一般の個人が独自のスクレイパーを...
Anthropicは、米国証券取引委員会(SEC)へ新規株式公開(IPO)に向けたドラフト登録届出書(Form S-1)を機密提出したと発表した。直近の資金調達で評価額9,650億ドルに達し、OpenAIを上回る成長を見せる同社の動向は、AI業界の競争環境を大きく変える可能性がある。