网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月14日
漏签
0
天
游戏王masterduel吧
关注:
198,482
贴子:
9,116,091
看贴
图片
吧主推荐
玩乐
3
回复贴,共
1
页
<返回游戏王mast...吧
>0< 加载中...
科乐美正在研究用强化学习教模型打牌
取消只看楼主
收藏
回复
D-shift
弑神之矛
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
看了一下还是传统的机器学习的方法。也是,目前拿大模型推理跑打牌ai有点得不偿失了,收益比不上电费说是。不过这么搞是不是伊格尼斯者要来了?
送TA礼物
贴子含AI内容
IP属地:北京
来自
Android客户端
1楼
2025-09-18 15:25
回复
D-shift
弑神之矛
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
看了下简介说目前k社他们的强化学习方法无法超越规则类的ai(也就是脚本辅助的),主要是能解决新环境的模型上手问题(也就是没有玩家数据下模型怎么打,比如各种杯赛),k现在出卡出表不仅能大数据还能模拟环境了
IP属地:北京
来自
Android客户端
2楼
2025-09-18 15:29
回复
收起回复
2026-06-14 10:23:16
广告
不感兴趣
开通SVIP免广告
D-shift
弑神之矛
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不用ppo的原因是 gpu 効率が悪い也太真实了
,不知道这帮人有没有兴趣借鉴一下GRPO的思路(
IP属地:北京
来自
Android客户端
4楼
2025-09-18 15:43
回复
收起回复
D-shift
弑神之矛
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
吐槽一句日本人的ai论文居然还只有JSAI学会成员才能看
这么封闭的环境怪不得搞不出好成果
IP属地:北京
来自
Android客户端
6楼
2025-09-18 15:56
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
拉锯战!五星巴西战平摩洛哥
2656410
2
FUT选手鞭尸,EDG翻盘复仇
2029101
3
补时绝平!卡塔尔1-1扳平瑞士
1857436
4
艰难取胜!BLG淘汰WE进决赛
1428138
5
昙花六现,张雪机车夺第六冠
1156870
6
看球遇险,中国球迷在墨西哥被抢
955750
7
英格兰队被偷到只剩足球
890496
8
日吹=伪球迷?吧友开杠
827977
9
日本炸鸡秘方:一锅油用66年
688380
10
明抄暗讽,电棍向炫神道歉
598101
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示