株式会社ずんだもん技術室AI放送局

Episodes

株式会社ずんだもん技術室AI放送局 podcast 20241204

Dec 3 2024

関連リンク AWS Strengthens Amazon Bedrock with Industry-First AI Safeguard, New Agent Capability, and Model Customization AWSはre:Inventカンファレンスにおいて、生成AIアプリケーション構築・拡張のためのフルマネージドサービスであるAmazon Bedrockの機能強化を発表しました。主な強化点は以下の3点です。 Automated Reasoning checks: 生成AIモデルの「幻覚（hallucination）」と呼ばれる、事実と異なる回答を生成してしまう問題に対処する、業界初のセーフガードです。論理的に正確で検証可能な推論を用いて、モデルの回答の正確性を検証し、監査可能な出力と推論過程を提供します。これにより、医療、金融、政府機関など、正確性が極めて重要な分野での生成AI活用が促進されます。PwCは、この機能を活用して、高精度で信頼性の高いAIアシスタントを構築しています。マルチエージェント連携: 複数のAIエージェントを容易に構築・調整し、複雑なタスクを共同で解決できるようにします。単一のAIエージェントでは困難な、大量のデータ分析や複雑なワークフローの自動化が可能になります。金融機関では、デューデリジェンスプロセスにおける複数の専門エージェントの連携による効率化が期待できます。Moody’sは、この機能を用いたリスク分析ワークフローの強化を進めています。 Model Distillation: 大規模モデルの知識を、より小型で効率的なモデルに転送する機能です。元のモデルと比較して最大500%高速化、75%のコスト削減を実現しつつ、精度低下は2%未満に抑えられます。これにより、リアルタイムでのチャットインタラクションなど、低レイテンシと低コストが求められる本番環境での利用に最適なモデルを簡単に作成できます。Robin AIは、この機能を活用して、膨大な契約条項に対する高品質な法的Q&Aを提供しています。これらの新機能により、Amazon Bedrockは、概念実証から本番環境への移行を迅速化し、生成AIの導入障壁を低くします。既に数万社がAmazon Bedrockを利用しており、その顧客数は過去1年で4.7倍に増加しています。引用元: https://press.aboutamazon.com/2024/12/aws-strengthens-amazon-bedrock-with-industry-first-ai-safeguard-new-agent-capability-and-model-customization ‎Gemini - chat to supercharge your ideas Googleが提供するGeminiは、アイデアを強化するためのチャットインターフェースです。ログインが必要です（リンク先： https://accounts.google.com/ServiceLogin?passive=1209600&continue=https://gemini.google.com/app/07b8daed57e45ad9&followup=https://gemini.google.com/app/07b8daed57e45ad9&ec=GAZAkgU）。 Googleアプリと連携して利用できるサービスであり、具体的な機能や使い方は記載されていませんが、その名前から、チャットボットを用いたアイデア創出や作業効率化を支援するツールだと推測できます。詳細な使用方法については、ログイン後にアプリ内で確認する必要があります。新人エンジニアの方にとって、アイデア出しや問題解決に役立つ可能性のあるツールと言えるでしょう。引用元: https://gemini.google.com/app/07b8daed57e45ad9 DevTools の使い方を可能な限りスクショ付きで解説してみるこのドキュメントは、Chrome DevTools の使用方法をスクリーンショット付きで解説したものです。 Lighthouseによるパフォーマンス計測、Performanceタブでの読み込み時間分析、Networkタブでのネットワークリクエストの分析、MainタブでのCPU使用状況の確認、Sourceタブでのリクエストの書き換え、Memory Profilerによるメモリ使用量分析、CSS OverviewsによるCSSセレクタの確認といったDevToolsの主要機能の使い方を詳細に説明しています。概要: 記事では、Chrome DevToolsを用いたウェブサイトのパフォーマンス分析方法を、多数のスクリーンショットを用いて解説しています。Lighthouseを用いたパフォーマンススコアの計測と解釈、Performanceタブでの読み込み時間とCPU使用状況の分析、Networkタブでのネットワークリクエストの分析、さらに、リクエストの書き換えやメモリ使用量の分析、CSSセレクタの確認方法についても説明しています。 Chrome拡張機能の影響を避けるため、計測時には拡張機能を無効化することを推奨しています。制約: 解説はChrome 131時点のスクリーンショットに基づいており、UIは今後変更...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241203

Dec 2 2024

関連リンク The Morning After: Elon Musk wants the court to stop OpenAI becoming a for-profit イーロン・マスク氏がOpenAIとマイクロソフトを相手取り、独禁法違反で差止命令を求める訴訟を起こしました。訴訟の目的は、OpenAIの営利企業への転換を阻止することです。マスク氏は今年初めにも、OpenAIが「人類の利益のためにAIを開発する」という設立理念に違反していると主張して訴訟を起こしましたが、数ヶ月後に取り下げています。8月にはカリフォルニア州の連邦裁判所に訴訟を起こしており、今回が3度目の訴訟となります。今回の訴状では、OpenAIとマイクロソフトが、マスク氏のxAIなどOpenAIの競合他社への投資を阻止するよう投資家に働きかけ、マイクロソフトとの関係を通じて不正に取得した競争上の機密情報や協調行為から利益を得ていると主張しています。つまり、マスク氏はOpenAIの営利化と、競合他社への不当な妨害を問題視しているのです。以前の訴訟とは異なり、今回は競合抑制という観点からの訴えとなっており、OpenAIとマイクロソフトの行動が競争環境に与える影響に焦点が当てられています。日本のエンジニアとして、この訴訟は、AI開発における競争の健全性、そして企業倫理や独占禁止法の重要性を改めて認識させる事例と言えるでしょう。引用元: https://www.engadget.com/general/the-morning-after-engadget-newsletter-121535788.html 夫がGoogleのGemini APIコンペで受賞してた筆者の夫が、GoogleのGemini APIを使ったコンペで受賞しました。約3000件の応募の中から9件が選ばれるという狭き門を突破したとのことです。開発されたアプリは、物体を認識して、被写体の顔にキャラクターを表示させ、会話させるという、動画で確認できるほど魅力的なものです。デザインも秀逸で、多くの人に受け入れられる見た目になっている点が評価されています。夫は過去にもGoogleのコンペで受賞経験があり、技術系コンペで好成績を収めることに長けているため、筆者からは「インターネット賞金稼ぎ」と呼ばれているそうです。このアプリは近いうちにリリース予定とのことです。なお、筆者自身も生成AIに関する書籍を出版しており、夫婦揃って生成AIに造詣が深いことがわかります。その書籍は、AIに詳しい「からあげさん」にもネーム確認を受けており、生成AI初心者にも分かりやすい内容になっているとのことです。書籍の購入はVALUE BOOKS（日本在住者向け）とAmazon（海外在住者向け）から可能です。引用元: https://www.imagawa.tokyo/entry/2024/12/01/191758 長年の誤ったパスワードポリシーが推奨された原因はあの偉人の論文だった？この記事は、長年推奨されてきた複雑なパスワードと定期的な変更というパスワードポリシーが、実は誤っていたという内容です。この誤ったポリシーが定着した原因として、Unix開発者ケン・トンプソンと暗号学者ロバート・モリスによる1979年の論文「Password Security: A Case History」が大きく影響したと指摘しています。この論文は、パスワードの安全性を高めるために複数の文字種（小文字、大文字、数字、記号）を含む複雑なパスワードを推奨しました。しかし、実際には「p@ssword」のような推測しやすいパターンも多く、セキュリティ向上には繋がっていないことが現在では明らかになっています。さらに、論文ではパスワードをハッシュ化して保存する方法が提案されました。この方法は、研究者によるパスワードの実態調査を困難にし、パスワードに関する知見の蓄積を停滞させる結果を招きました。つまり、一見有効に思えたこの論文の推奨事項が、長年に渡りパスワードセキュリティの向上を阻害してきたというわけです。 NIST SP 800-63ガイドラインの改訂によって、「パスワードは複雑さより長さ」という考え方が主流になりつつありますが、この歴史的背景を知ることで、セキュリティポリシー策定の難しさや、一見正しいと思える施策の長期的な影響を考慮する重要性を改めて認識できます。この記事は、過去の偉大な科学者たちの誤りから、セキュリティ対策を考える上で重要な教訓を与えてくれています。引用元: https://yamdas.hatenablog.com/entry/20241202/bad-password-policies ...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241202

Dec 1 2024

関連リンク執行役員になって1年くらい経ちました KyashのVP of Engineeringとして2022年1月から開発組織のマネジメントに携わり、2024年1月から執行役員に就任した著者が、その1年間を振り返る記事です。当初は役割の変化は少ないと考えていましたが、想像以上に変化がありました。Kyashの事業は決済ユーザー数の増加と事業全体の収益性改善という成果を上げており、B2B領域の法人送金サービスの立ち上げも成功しています。しかし、著者は自身の貢献度を低く評価しており、「自分は何をすべきか」「事業成長にどう貢献できるのか」という疑問を抱くようになりました。執行役員になったことで、周囲からの期待や見られ方が変化したことを実感します。「役員としての意見ですか？」と問われたり、「konifarさんが役員になって何か変わりましたっけ？」と問われたりした経験から、自分の発言がどう捉えられるかを意識するようになり、成果を出すことの重要性を再認識しました。経営会議への参加を通して、会社全体の収益やコスト構造を理解するようになりましたが、議論を前に進めるような行動はできていませんでした。また、多くの業務を自ら担っている現状は、役割の委譲ができていないことの表れだと反省しています。現在は「1年以上先を想像して組織を作っていく」ことをミッションに、組織体制の課題解決や開発生産性向上に取り組んでいます。COOからの「マネジメントはマネジメントにしかできないことをやらないと意味がない」という言葉に背中を押され、採用活動にも力を入れています。この1年間は試行錯誤の連続で、しんどい時期もありましたが、執行役員という立場だからこそ気づけたことも多くありました。今後は、エンジニアリングの知識・経験を活かし、経営に的確な提案を行うことを目指しています。2025年末まではフルコミットし、最高のプロダクトと組織作りに貢献したいと考えています。現在、Mobile/Serverside/SRE/Dataのポジションを募集しています。引用元: https://konifar.hatenablog.com/entry/2024/12/01/171150 キーボードの音響に関する考察この記事は、自作キーボードの音響設計に関する考察をまとめたものです。著者は、これまで設計したキーボードの経験から得られた知見に基づき、キーボードの音響特性に影響を与える要素を詳細に分析しています。キーボードの音は、大きく分けて「衝突音」「主音」「残響音」の3つに分類でき、それぞれ発生源や伝播経路が異なります。衝突音はキースイッチのステムとボトムハウジングの衝突で発生し、スイッチの素材や形状に大きく依存します。主音は、衝突音によって生じた振動がスイッチプレート、PCB、キーキャップなどのパーツに伝播し、それらが空気中に放射することで発生します。残響音は、ケースなどの筐体で音が反響することで発生し、理想的には鳴らない方が良いとされています。これらの音響特性に影響を与える要素として、以下の点が挙げられています。キースイッチ: 素材、形状、構造により衝突音の特性が変化します。スイッチプレート: 素材（金属、プラスチックなど）と厚さによって発する音の高さや響きが変化します。ケース: 素材、形状、マウント方法によって振動の伝わり方が変わり、残響音に影響します。PCB: 厚さ、スリットの有無、素材、裏面の処理（テープモッドなど）によって音響特性が変化します。キーキャップ: 素材、形状、プロファイルによって発する音の高さや響きに影響します。フォーム: PCBやスイッチプレートの間に配置することで、振動を吸収し、音を調整できます。しかし、万能ではなく、素材や配置方法によって効果が異なります。著者は、これらの要素を組み合わせることで狙った音を実現できると述べていますが、組み合わせが多いため試行錯誤が必要であると強調しています。特に、キースイッチとキーボードの相性は重要で、単体で良い音のスイッチでも、特定のキーボードでは好ましくない音になる可能性があります。最後に、著者が設計したキーボード「Tochka52」の例が紹介されています。Tochka52は、複数の素材を積層した...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241129

Nov 28 2024

関連リンク大人数チームで意思決定のスピードアップのためにやったこと食べログの予約サービスチームは、利用者増加に伴う組織拡大により、コミュニケーションコスト増大、情報伝達の遅れ、開発スピードの遅延といった課題に直面していました。これらの課題解決のため、チームは組織編成と情報共有方法に工夫を凝らしました。まず、2名のエンジニアリングマネージャー(EM)と、複数の小チーム（ユニット）からなるユニット制を採用しました。 EMはそれぞれ異なる領域（運用・改善、プロダクト開発）を担当し、責任範囲を明確化することで、意思決定の迅速化を図りました。さらに、チームリーダーを配置することで、チーム全体の方針やルールの決定を効率化しました。ユニットの規模を小さくすることで、リーダーの管理コスト軽減と、リーダーが自ら開発に携われる環境を整備しました。意思決定はボトムアップ型を取り入れ、メンバー、リーダー、マネージャーの各レベルで適切な権限と責任を明確化することで、スピードアップを図りました。情報共有は、日次と週次の2段階で行われます。日次では、ボトムアップ型で情報を集約し、重要な課題や意思決定事項を迅速に共有します。週次では、各ユニットからの情報をEMが集約し、チーム全体に展開することで、チーム全体の状況把握を容易にしました。他チームとの情報共有は、ユニットリーダーとEMが窓口となり、効率的な情報伝達を実現しています。今後の展望としては、他チームとのコミュニケーション改善、システムのリモデリングによるドメイン整理、エンジニアリングへの集中を促進するための更なるコミュニケーション改善に取り組むとしています。これらの取り組みを通じて、開発スピードの向上とエンジニアの生産性向上を目指しています。本記事は、大規模チームにおける組織設計と情報共有の改善に悩む日本のエンジニアにとって、貴重な参考事例となるでしょう。引用元: https://tech-blog.tabelog.com/entry/2024/09/tabelog-engineer-information-communication 本番DBのマスターデータを全行ぶっとばすやらかしをしたときのお話、その反省この記事は、本番DBのマスターデータを誤って全行削除してしまった事例とその反省について記述しています。深夜帯に稼働するSNSサービスにおいて、マスタデータのJSON型カラムを全てブランク値で上書きする作業中に事故が発生しました。原因は、開発環境での動作確認を省略した、UPDATE文によるデータ更新スクリプトの誤作動です。復旧はRDSのスナップショットからの復元で行われましたが、データ容量が大きかったため1時間程度を要しました。この経験から、以下の反省点が挙げられています。バックアップの不足: 作業前にSequel ACEによるレコードエクスポートや、CSV形式でのバックアップ（Copy Insert SQL機能活用）を行うべきでした。大量データの場合は、LIMITとOFFSETを使用して分割バックアップが推奨されます。トランザクションの未活用: START TRANSACTIONとCOMMIT/ROLLBACKによるトランザクション処理を行うべきでした。これにより、更新クエリ実行後のデータ確認を行い、問題なければコミット、問題があればロールバックすることで、データの整合性を確保できます。スクリプトからの直接クエリ実行: Pythonスクリプトで直接更新SQLを実行する実装は、事故発生時の影響が大きいため避けるべきです。スクリプトはクエリの生成のみとし、実行は手動で行うべきです。開発環境での動作確認の省略: 過去に同様のスクリプトを使用していたため、開発環境での動作確認を省略しましたが、これは重大なミスでした。時間的制約があっても、開発環境での動作確認は必須です。この事例は、本番環境での作業におけるリスクと、それを回避するための対策を学ぶ上で非常に貴重な教訓となります。新人エンジニアは、この経験から学び、本番作業前に必ずバックアップを取得し、トランザクション処理を行い、開発環境での動作確認を徹底するよう心がけましょう。引用元: https://zenn.dev/kazutosakagami/articles/78d1649389c868 Raspberry Pi Compute Module 5 cranks up the power – and the...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241128

Nov 27 2024

関連リンク Former Android leaders are building an ‘operating system for AI agents’ 元Androidのリーダーたちが、AIエージェント向けの「オペレーティングシステム」を開発するスタートアップ企業「/dev/agents」を設立しました。 Googleの元Android製品管理担当副社長であるHugo Barra氏によると、同社はAI業界に「Androidのような革新」をもたらすことを目指しています。現在、Microsoft、Google、OpenAIなど多くの企業が、自律的にタスクを実行し意思決定を行うAIエージェントの開発に注力しています。しかし、/dev/agentsのCEO兼共同設立者である、Googleの元Androidエンジニアリング担当副社長David Singleton氏は、現状では開発が困難であると指摘しています。 /dev/agentsは、クラウドベースの次世代AIエージェント用OSを開発中で、ユーザーが様々なデバイスで信頼できるエージェントと連携することを目指しています。 Singleton氏によると、AIエージェントには新しいUIパターン、再考されたプライバシーモデル、そして有用なエージェントを簡単に構築できる開発プラットフォームが必要だと述べています。同社には、Barra氏に加え、MetaでAR/VR担当副社長を務めた元AndroidエンジニアのFicus Kirkpatrick氏（CTO）、ChromeOSのデザインに携わったNicholas Jitkoff氏（最高デザイン責任者）も参加しています。彼らは、Android開発で培った経験を活かし、AIエージェント開発の課題解決に挑んでいます。この新しいOSが、AIエージェントの開発と普及に大きな影響を与える可能性があります。引用元: https://www.theverge.com/2024/11/27/24307525/android-leaders-dev-agents-ai-agent-operating-system-startup Tailor Claudes responses to your personal style Claude.aiは、ユーザーのニーズに合わせてレスポンスのスタイルをカスタマイズできる機能を発表しました。開発者、マーケター、プロダクトチームなど、様々なユーザーが自身のワークフローに最適化されたレスポンスを得られるようになります。この機能により、Claudeのレスポンスのトーン、構造、形式を調整できます。プリセットとして、「Formal（フォーマル）」「Concise（簡潔）」「Explanatory（説明的）」の3つのスタイルが用意されています。「Formal」は洗練された明確なレスポンス、「Concise」は短く直接的なレスポンス、「Explanatory」は新しい概念を学ぶための教育的なレスポンスを提供します。さらに、ユーザー自身でカスタムスタイルを作成することも可能です。自分の好みのコミュニケーションスタイルを反映したサンプルコンテンツをアップロードし、必要な指示を指定することで、Claudeは独自のスタイルを生成します。 GitLab社のように、ビジネスケースの作成、ユーザー文書の更新、マーケティング資料の作成・翻訳など、様々な場面で一貫したコミュニケーションを維持するために活用できます。使い方は簡単です。Claude.aiのチャットボックスで、プリセットオプションを選択するか、独自のスタイルをカスタマイズするだけです。自分の自然な作業スタイルに合わせてClaudeを調整し、生産性を向上させることができます。引用元: https://www.anthropic.com/news/styles OpenAI gets $1.5 billion investment from SoftBank in tender offer CNBCの報道によると、ソフトバンクがOpenAIに15億ドルの投資を行うことが発表されました。これは、公開買い付け（テンダーオファー）という形で実施されたものです。このニュースは、OpenAIの急速な成長と、その将来性への高い期待を示唆しています。日本のエンジニアの皆さんにとって、このニュースは、AI分野における技術革新のスピード感、そして巨額の資金がどのように最先端技術開発に投入されているのかを理解する上で重要な示唆となります。 OpenAIの技術は、様々な業界で活用されており、今後も更なる発展が期待されるため、この投資は今後のAI技術開発に大きな影響を与える可能性があります。特に、日本の企業がAI技術を導入・開発していく上でも、この様な大規模投資による技術開発の動向を注視していくことが重要になります。引用元: https://www.cnbc.com/video/2024/11/27/openai-gets-1-point-5-billion-investment-from-softbank-in-tender-offern-a-tender-offer.html デマに騙されちゃダメ。Pingで帯域計測は出来...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241127

Nov 26 2024

関連リンク 7 examples of Gemini’s multimodal capabilities in action GoogleのシニアプロダクトマネージャーLogan Kilpatrickによるブログ記事では、Gemini 1.5 Pro(画像・動画理解に最適化されたモデル)を用いたマルチモーダル機能の7つの実例が紹介されています。Geminiは、画像・動画だけでなく、長文PDF(1000ページ以上)も理解し処理できます。主な機能と例: 詳細な画像説明: 画像の内容を詳細に記述し、質問にも回答できます。プロンプトに応じて説明の長さ、トーン、形式を調整可能です。長文PDFの理解: 1000ページ以上のPDFを理解し、表の転記、複雑なレイアウトの解釈、図表・スケッチ・手書き文字の認識、構造化された出力やコードの生成が可能です。例として、15四半期のAlphabetの収益報告書(152ページ)からGoogleの収益データを抽出し、表を作成し、matplotlibを用いたグラフを作成する例が示されています。現実世界の文書の推論: レシート、ラベル、看板、メモ、ホワイトボードのスケッチなど、現実世界の文書から情報を抽出し、JSONオブジェクトとして返すことができます。ウェブページデータの抽出: ウェブページのスクリーンショットからデータ(画像・動画を含む)を抽出し、JSONなどの構造化された形式で出力できます。ウェブデータAPIやブラウジングエージェントなどのアプリケーションに活用できます。Google Playの書籍ページから書籍名、著者、評価、価格をJSON形式で抽出する例が示されています。物体検出: 画像内の物体を検出し、バウンディングボックス座標を生成します。ユーザー定義の基準に基づいて物体を検索・推論する機能も備えています。動画の要約と転写: 最大90分の動画を処理し、要約や転写を作成、日常シーンからの構造化データの抽出、質問への回答、重要な箇所の特定などが可能です。技術講義の動画を高校生向けに要約する例が紹介されています。動画からの情報抽出: 動画から情報を抽出し、リスト、表、JSONオブジェクトなどの構造化された形式で出力できます。小売、交通、ホームセキュリティなどの分野でのエンティティ検出、スクリーン録画からの非構造化データ抽出などに役立ちます。制約: 動画処理においては、現状1FPSのサンプリングのため、一部情報が欠落する可能性があります。より高いFPSでのサンプリングは今後の開発予定です。 Gemini APIを活用した開発には、開発者ガイドと開発者フォーラムが役立ちます。様々なユースケースに対応できる強力なマルチモーダル機能を備えていることがわかります。引用元: https://developers.googleblog.com/en/7-examples-of-geminis-multimodal-capabilities-in-action/ Now Hear This: World’s Most Flexible Sound Machine Debuts NVIDIAの研究チームが開発した画期的なAIサウンド生成モデル「Fugatto」は、テキストプロンプトだけで音声を生成・変換できる、世界最高レベルの柔軟性を誇るツールです。既存のAIモデルが特定の音声生成や編集に特化しているのに対し、Fugattoは音楽、音声、効果音などを自由に組み合わせ、テキストと音声ファイルの両方から指示を受け付けることができます。例えば、「悲しい雰囲気のフランス語で話すテキスト」といった複雑な指示にも対応し、アクセントの強さや感情の度合いを細かく調整できます。既存の楽曲に楽器を追加・削除したり、声のアクセントや感情を変えることなども可能です。さらに、既存データにはない全く新しいサウンドも生成できます。例えば、トランペットが吠えたり、サックスが鳴き声をあげたりといった、想像を超える音も作成可能です。 Fugattoは、音楽制作、広告制作、言語学習ツール、ゲーム開発など、幅広い分野で活用できます。音楽プロデューサーは楽曲のプロトタイプ作成や編集に、広告代理店は多言語・多様な感情表現のボイスオーバー作成に活用できます。言語学習ツールでは、好きな声で学習コンテンツをパーソナライズすることも可能です。ゲーム開発者は、ゲーム内の状況に合わせて効果音をリアルタイムで生成・変更できます。 Fugattoは、音声モデリング、音声符号化、音声理解に関するNVIDIAの以前の研究成果を基盤としています。25億個のパラメータを...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241126

Nov 25 2024

関連リンクニアリアルタイムのデータ基盤を構築して得られたものと課題本資料は、タイミー社がニアリアルタイムデータ基盤を構築した経験とその課題について報告しています。以前のデータ基盤はバッチ処理中心で、データの適時性と整合性に課題がありました。具体的には、数時間～1日の遅延と、データ更新による整合性の欠如が発生していました。そこで、Google Cloud Datastreamを活用したニアリアルタイムデータ基盤を構築しました。embulkからDatastreamへの移行、dbtで生成するテーブルをviewに変更するなどのアーキテクチャ変更を行いました。その結果、データの適時性は数時間～1日から15分程度に、整合性のずれも数時間単位から最大4時間～1日に改善されました。しかし、新たな課題も発生しました。Datastreamの不安定性が顕著になり、最大3時間以上の停止や、数分～1時間弱の頻繁な停止・復旧が発生するなど、運用上の課題が残っています。これらの課題を踏まえ、社内ユースケースの整理を行いました。その結果、完全性が求められる業務の方が、適時性が求められる業務よりも多いことが判明しました。そのため、短期的な対応として完全性を担保できる基盤を構築し、適時性が必要なユースケースもサポートする方針となりました。長期的な対応としては、適時性データ基盤の連携方法を再検討していく予定です。引用元: https://speakerdeck.com/chikushi/niariarutaimunodetaji-pan-wogou-zhu-sitede-raretamonotoke-ti 5指駆動「サイボーグ義手」が実現した理由。“実用化だけ”を見据えた研究者たち【フォーカス】レバテックラボ（レバテックLAB）長年、実用化が困難だった5指駆動の筋電義手が、電気通信大学の研究者らによって「BITハンド」として実現しました。本記事は、開発を主導した東京理科大学助教の山野井佑介氏へのインタビューに基づき、その成功要因を解説しています。従来の筋電義手研究は、人体の動きを完璧に再現することに注力していましたが、そのため義手が大型化・重量化し、実用性に欠けていました。山野井氏らの研究チームは、このアプローチを見直し、「日常生活に必要な把持動作の85％をカバーする」ことを目標に、軽量化と簡素化を優先しました。具体的には、親指と他の指の独立した動作により、「握力把持」「精密把持」「側面把持」の3つの基本動作を実現。ペットボトルの開閉やスマートフォンの操作など、日常生活に必要な動作を可能にしました。重量は約600gに抑えられ、装着者の負担を軽減しています。技術面では、機械学習を用いた信号処理技術が鍵となりました。微弱な筋電位信号から、着用者の意図を正確に読み取ることで、5本の指を独立して制御しています。特に、先天的な上肢欠損者にも対応できるよう、個々の筋電位パターンをAIが学習する仕組みを構築しました。さらに、Bluetooth通信によるデータ送受信や、スマートフォンからの制御ソフトウェア開発など、実験効率の向上にも取り組んでいます。これらの工夫により、開発期間の短縮とコスト削減を実現しました。しかし、実用化されたにも関わらず、国内での普及率は依然として低い状況です。高価で重いという従来のイメージが根強く残っていること、そしてその利便性が広く知られていないことが課題となっています。山野井氏らは、認知度向上とさらなる機能改善を目指し、研究開発を継続していくとしています。引用元: https://levtech.jp/media/article/focus/detail_565/ 【JavaScript × Terraform】次世代のモダン AltJS「JS.tf」の紹介 JS.tfは、HCL(Hashicorp Configuration Language)を用いてJavaScriptプログラムを記述する、Terraformのプロバイダーです。terraform applyを実行することで、HCLで記述されたコードがJavaScriptにトランスパイルされ、Node.jsなどのJavaScriptランタイムで実行できます。 JS.tfの基本的な使い方は、required_providersブロックにkoki-develop/jsを追加し、terraform initでインストールすることから始まります。プログラムの記述にはjs_programデータソースが中心となります。変数・定数の定義にはjs_var, js_const, js_let、演算にはjs_operation、関数定義にはjs_function、関数呼び出しにはjs_function_call...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free
株式会社ずんだもん技術室AI放送局 podcast 20241125

Nov 24 2024

関連リンク Gemini AI asst suggesting answers to my emails - Hell NO! Gmailユーザーが、メール作成時にGemini AIによる回答候補が表示される機能に不満を訴えているGoogleヘルプフォーラムの投稿です。ユーザーは、この機能が邪魔で自分の考えでメールを書きたいと考えており、機能の無効化方法を質問しています。AIによる自動化が思考停止を招くという懸念も表明されています。現状では、この機能を無効化する具体的な方法は提示されていません。投稿は比較的新しいものですが、Googleからの回答はまだありません。この投稿は、AIアシスタントの過剰な介入に対するユーザーの抵抗感を示す事例として参考になります。日本のエンジニアにとって、この事例は、ユーザーエクスペリエンス(UX)設計や、AI技術導入におけるユーザーの感情への配慮の重要性を再認識させるものです。 AIによる自動化の利便性と、ユーザーの自主性や創造性を尊重することのバランスが、今後のシステム開発において課題となるでしょう。引用元: https://support.google.com/mail/thread/309622575/gemini-ai-asst-suggesting-answers-to-my-emails-hell-no%3Fhl%3Den [アップデート] AWS Step Functions で変数が使えるようになりました DevelopersIO AWS Step Functionsに、変数の使用とJSONataのサポートが追加されました。これにより、ステートマシンにおけるデータの受け渡し処理が大幅に簡素化されます。以前は、Step Functionsでステート間の値の受け渡しは、各ステップで結果を明示的に次のステップに渡す必要があり、複雑で非効率的な作業でした。しかし、今回のアップデートで変数を定義し、ステート間で値を容易に共有できるようになりました。例えば、あるステップで計算した結果を変数に格納し、後続のステップでその変数を参照することで、データの受け渡しを簡略化できます。具体的には、Pass、Task、Map、Parallel、Choice、Wait ステートで変数が利用可能です。変数はJSON形式で指定し、マネジメントコンソールで変数タブから設定できます。一度の変数割り当ての最大サイズは256 KiB、ステートマシン全体で保存される変数の合計サイズは10 MiBに制限されているため、注意が必要です。また、変数のスコープにも注意が必要です。ParallelやMapステート内で定義した変数は、その内部でのみ参照可能です。上位のステップで定義された変数は下位のステップから参照できますが、下位ステップで定義された変数は上位ステップからは参照できません。ParallelやMapステート内で定義した変数を他のステップで使用したい場合は、明示的に出力として渡す必要があります。さらに、JSONataというクエリ言語がサポートされました。これにより、ステートマシンの設定がより柔軟で直感的になります。JSONPathも引き続き利用可能です。今回のアップデートにより、Step Functionsのワークフロー設計が大幅に簡略化され、より効率的で分かりやすいステートマシンの構築が可能になります。変数のサイズとスコープに注意しながら、積極的に活用することで開発効率の向上に繋げましょう。引用元: https://dev.classmethod.jp/articles/step-functions-variables/ ORMなんていらない？！生SQLクエリ開発を超絶楽にするVSCode拡張を作った [TS+Rust+WASM] この記事は、TypeScriptとRustで記述された、VSCode拡張機能「sqlsurge」の紹介です。sqlsurgeは、PrismaやSQLxといったORMを使用せず、生SQLクエリを記述する際に、SQLの構文補完やエラーチェックといったLSP(Language Server Protocol)機能を提供します。主な機能は、TypeScriptとRustのコード内にある生SQLクエリを検出し、VSCodeのVirtual Document機能とRequest Forwardingを用いて、Go製のSQL Language Serverである「sqls」と連携することで、SQLクエリに対する補完機能を実現する点です。 TypeScriptではPrisma、RustではSQLxをサポートしており、Prismaを使用している場合はSQLのシンタックスハイライトも有効になります。 sqlsurgeは、TypeScript/RustのAST(抽象構文木)を解析して生SQLクエリを特定します。Rustの部分はWASM(WebAssembly)に変換され、VSCode上で動作します。開発にはwasm-packを使用しており、CIにはGitHub Actionsを用いてUbuntuとmacOS上でのテストを実施しています。現状ではPrismaとSQLxのサポートが...
Show More Show Less

Less than 1 minute

Failed to add items

Sorry, we are unable to add the item because your shopping cart is already at capacity.

Add to basket failed.

Please try again later

Add to wishlist failed.

Please try again later

Remove from wishlist failed.

Please try again later

Adding to library failed

Please try again

Follow podcast failed

Unfollow podcast failed

Listen for free

Audiobook Categories

Popular Lists

Explore Audible

Episodes

株式会社ずんだもん技術室AI放送局 podcast 20241204

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241203

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241202

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241129

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241128

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241127

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241126

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed

株式会社ずんだもん技術室AI放送局 podcast 20241125

Failed to add items

Add to basket failed.

Add to wishlist failed.

Remove from wishlist failed.

Adding to library failed

Follow podcast failed

Unfollow podcast failed