专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀,以及偶尔开开车🚗
🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
🌐网站:https://geekshare.org/
🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
🌐网站:https://geekshare.org/
该项目基于 tldraw 和 GPT-4- Vision API,它的工作原理是获取当前画布的 SVG,将其转换为 PNG,然后将该 PNG 发送给 GPT-4-vision,并指示其返回带有 Tailwind 的单个 html 文件
ChatGPT 愈发牛逼,套壳 AI 创业也将愈发困难
📮投稿 📢频道 💬群聊
安装插件之后,需要付费解锁的文章右侧会出现两个按钮,点击任意一个都可以查看该文章的完整内容
📮投稿 📢频道 💬群聊
美东时间11月6日,OpenAI 在旧金山举办的首届开发者大会上发布了最新 GPT-4 Turbo 人工智能模型,并且允许用户创建 ChatGPT 自定义版本,以下是部分总结
▫️上下文长度从 8K 提升至 128K;
▫️多模态视觉、DALL·E 3 和语音合成 API 一起开放;
▫️知识库更新到 2023 年 4 月;
▫️对部分企业开放 GPT4 微调
▫️GPT4 输入降低 70%,输出降低 50%;
▫️与 GPT-4 相比。Turbo 整体价格降低超过 2.75 倍;
▫️降低 GPT-3.5 Turbo 16K的价格,输入降低 4 倍,输出降低 3 倍
发布 GPT Assistant API:可以帮助开发者在自己的应用程序中构建 Agent,包含代码解释器、知识库、函数调用
📮投稿 📢频道 💬群聊
这个程序前台没啥好说的,基本和市面上的大同小异,亮点在于后台功能比较完善
📮投稿 📢频道 💬群聊
Grok 是一款模仿《银河系漫游指南》的人工智能,马斯克曾直言这是他最喜欢的科幻小说
Grok 最亮眼的特点便是能回答大多数其他聊天机器人拒绝回答的“敏感问题”
▫️25000 Tokens 的上下文窗口
▫️采用了 Rust 语言以及深度学习框架新秀 JAX(无Python)
▫️极快的响应速度,能实时获取 𝕏 的信息
▫️Grok 的知识库是基于 886.03GB 的开源语言数据库 The Pile 和整个 𝕏 平台的 Exabytes 数据库微调而成;
▫️计划提供 API,还有图像识别和音频识别
▫️Grok 的一个版本将使用本地计算能力在 Tesla 中「本地」运行
Grok 结束早期测试后,会向的所有 𝕏 Premium+ 订阅者开放,每月 16 美元
xAI 背靠 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的数据,这两大优势极有可能会弯道超车 ChatGPT,实现真正意义上的通用人工智能,让我们拭目以待
还得是你马一龙
📮投稿 📢频道 💬群聊
软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
视频:马斯克和苏纳克对 AI 的讨论(前5分钟
语音识别模型:whisper base
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
PS:支持日语,未测试
📮投稿 📢频道 💬群聊