forum.gl-inet.cn

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
    查看: 4182|回复: 6

    [经验分享] 必看(重要):MT2500变砖问题的全程跟踪及深度分析

    [复制链接]

    3

    主题

    86

    帖子

    1042

    积分

    金牌会员

    Rank: 6Rank: 6

    积分
    1042
     楼主| 发表于 4 天前 | 显示全部楼层 |阅读模式
    本帖最后由 Oasis.cn 于 2024-11-30 17:30 编辑

    MT2500变砖的话题是从2024年元月份开始的,至少本论坛第一个有帖子的案例是元月17日,短短一周时间就上升到4、5例,然后每个月都有报变砖的帖子,若按时间线推算,基本是在MT2500上市一年左右,从网友故障投票贴和各个变砖网友使用环境来看,与固件的版本无关、与刷没刷第三方固件无关,变砖的机器都可进UBOOT做刷机操作,但无论刷机与否重启依然是“砖”。比较奇葩的是glinet全系列中有无故集中变砖故障的仅发生在MT2500这一个型号上,同为MT7981方案其他机型均无此案例,由于同样故障大量爆发、故障现象一致且基本都是购买使用1年左右时间出现,很多技术能力强的机友开始怀疑产品有设计瑕疵

    1、重要:在此,先设个断点,先看看MT2500刚上市时一个机友的老帖子
    -------------------------------------------------------------------
    2022年11月27日MT2500上市不长时间机友sun2022就在本论坛发帖“[问题反馈] 关于mt2500散热问题”,其中就质疑MT2500全系列(无论是塑壳还是全金属壳)均未做任何芯片级散热,金属壳版本也未用散热硅贴垫高连接芯片跟金属壳体散热
    https://forum.gl-inet.cn/forum.php?mod=viewthread&tid=1060
    官方“萝卜大侠”(当时官方论坛认定技术权威回复代表账号)总体意思就是(摘录原话):1、“不加导热硅胶的最高温度是76℃,对人来说,这个温度很高了,但这个温度对于芯片(说简单点就是沙子)来说,还是比较舒适的温度”,以解释高温不算什么(维护MT2500不加任何散热器是正常的选择);2、“考虑到很多用户是便携使用场景,一般不会超过3小时,这种情况下,不加硅胶的方案手感体验更佳”,以解释官方不加导热硅胶将芯片热量通过壳体散热是为用户体验着想;3、“增加导热硅胶,产品生产装配复杂度会提高”,意思就是增加导热硅胶会增加材料成本和装配成本(感觉这个才是本质问题)。总之一句话,“萝卜大侠”认为MT2500小巧便携的设计就是为出差移动用户场景设计的(一般使用不会超过3小时),短时的高温不会有任何问题,盲目增加散热只会增加设备制造成本,所以维持原判,针对机友提出设计无任何散热措施的质疑给与否决,殊不知很多人买MT2500都是长期弱电箱旁路有24小时不关机使用

    2、时间线回到2024年11月26日,在MT6000网友zhangfen137打破砂锅问到底并一路追问到其他MT2500大量故障质疑服务(我认为是有理有据,逻辑很清晰的网友)的一再追问下,负责AXT1800,MT3000,MT2500,MT6000的产品经理Diping在论坛中终于正面回复
    https://forum.gl-inet.cn/forum.p ... =24851&fromuid=9400
    现任产品经理认为问题的原因是与“EMMC的运行频率有关,我们在最新的临时固件将运行频率从52Mhz调整到26Mhz”


    我的分析:
    1、熟悉数字电路的网友都知道,在数字电路中上下级单元运行频率是要同步一致的,如果上位CPU设置EMMC工作频率52Mhz,下位EMMC颗粒只支持最高26Mhz的话,设备是跑不起来的,但MT2500里EMMC颗粒真的只能工作在26Mhz么?答案是否定的,所有变砖网友不是拿到设备头一周发生变砖问题,而跟踪很多人使用习惯发现都是长期插电不管或不断电放置弱电箱持续工作一年左右时间出现设备反应慢现象一到两天后设备变砖,很明显这是EMMC颗粒品质劣化的典型现象,持续工作于芯片某个极限(电压、温度、频率),EMMC颗粒厂商可能原设计就是在某个极限工作条件下到达电子元件国标托底最低达标时长后失效(也许就是一年吧),现象就是存储变慢后颗粒迅速劣化失效。其实懂晶体管集成电路的都知道,在能工作的条件下能加速晶体管老化的只有电压和温度,电压只要不临近集体管结构击穿电压就不是问题的本因,那问题就是在温度上。官方现在处置MT2500的方案是将本来就能正常工作的52Mhz EMMC频率降为26Mhz,再明显不过的原因了,这个动作的背后官方已经认定了MT2500变砖的原因是EMMC颗粒长期高温劣化所致,所以通过将工作频率降为一半来降低EMMC工作产生的温度,用以延长变砖的可用寿命,因为:(重要)MT2500原设计所有芯片均为裸片,无任何主被动增强散热措施,加之设备中外市场占有量巨大无力召回,既然工作温度无法降低,那最便捷应对这个准备下线的产品,且不必召回或进一步增加厂商后续保修成本的唯一办法就是硬生生降低emmc工作频率(降低设备在存储上IO性能)
    2、从MT2500刚上市网友贴图提出设备散热偷工减料行为,以及官方技术主官回复的技术型人才与生俱来固执型傲慢导致没有及时亡羊补牢修复硬件设计,这一切可能都是给MT2500后面爆发一系列问题埋的雷。官方傲慢的认为这种体积小巧的便携设备谁会拿来7*24小时来用,所以单纯就设定硬件设计标准只要满足3-4小时出差临时便携场景使用即可,产品只需关注体积小巧、重量业内首发、外观讨喜即可,其他一概可以成本省去。所以使用同样MT7981方案组合的其他包括华为、小米、360设备(全都考虑大散热片主被动散热)7*24小时好几年全都没问题,你MT2500基本上只要是7*24小时工作场景都得做好工作一年左右时间变砖的极大概率的必然。当然如果是刚买MT2500,出厂已被官方降频EMMC工作频率或抓紧打测试补丁用户自己主动降低EMMC工作频率的除外,这么做必然7*24小时工作场景使用一年左右时间是不会变砖的,也许是两、三年吧;
    3、给所有新老MT2500用户的建议,如果还没买那就加点钱直接下手带双面巨型散热片和涡轮风扇的MT3000,如果已买或刚买不久没法退货或无法退货了,那别犹豫了,赶紧拆开外壳自己给CPU、运存、EMMC颗粒全部加上散热片,金属壳的MT2500最好用导热硅片填充把芯片热量导到金属外壳上增加散热。另外没做任何额外散热的措施下,别用MT2500做dock或一大堆插件高内存占用、高CPU占用的工作扩展了,除非你想让你的MT2500更早报废变成一块砖头;
    4、一个疑点:机友iotdoc故障MT2500换回原厂好的EMMC后测试故障依旧
    https://forum.gl-inet.cn/forum.p ... =24695&fromuid=9400
    机友iotdoc属于维修工具多、动手能力强老鸟,年初MT2500变砖早期,他就以防万一将原厂EMMC拆下,用专业编程器提取数据复制到备份芯片,再将备份芯片焊回设备中使用,直到年底变砖,变砖后怀疑仅是EMMC坏,遂热风枪换回初始原厂备份封存的颗粒,结果令人乍舌的是故障现象依旧
    我的怀疑:因MT2500所有芯片均裸片未作任何主被动散热,所以7*24小时长期工作场景下,也许迅速劣化的不只是EMMC,EMMC仅仅只是最早绷不住的那块短板,其他也许MT7981 CPU也算一个吧...所以别等了,认栽的机友赶紧自己主动加散热吧

    回复

    使用道具 举报

    0

    主题

    4

    帖子

    194

    积分

    注册会员

    Rank: 2

    积分
    194
    发表于 4 天前 | 显示全部楼层
    今天变砖了,搜解决方案,就搜到这个帖子,官方固件未刷第三方

    点评

    后面有问题的都贴出来MT2500购买大致时间,使用习惯(譬如7*24小时弱电箱、每天至少10小时什么的),变砖时使用总月份,这些数据放这让官方看看  发表于 4 天前
    回复

    使用道具 举报

    3

    主题

    86

    帖子

    1042

    积分

    金牌会员

    Rank: 6Rank: 6

    积分
    1042
     楼主| 发表于 4 天前 | 显示全部楼层
    进一步查了下MT7981B和glinet MT3000配套的其他运存、SPI Flash芯片颗粒官方参数,用来推测Glinet官方选料考量

    1、MT7981B官方(这里说的是CPU芯片制造厂)芯片数据手册中未说明芯片工作温度,只是说该芯片有温度墙检测机制,一旦接近温度墙则会主动降频或中止执行方式保护CPU,由于MT7981B内置WiFi6,所以温度墙启动保护时网速还是否稳定,会不会发生断流,大家自己去体会。所以不要听信glinet官方回复的:“半导体其实就是沙子,76℃才是沙子感觉舒适的温度”的言论,只有保障了有效散热,才能确保你的CPU稳定平稳的全频率、满速率工作;
    2、MT3000原厂运存颗粒型号为南亚NT5AD256M16E4-JR,其数据手册工作温度为0-90℃,网友爱用三星1GB内存升级的颗粒为K4A8G165WB(C)-BCWE,三星官方数据手册工作温度为0-85℃;spi flash型号为MXIC MX35LF2GE4AD,MXIC官方数据手册工作温度为-40-85℃。提MT3000不是说MT3000选料有问题,而是说MT7981B方案所有芯片对工作温度都是有要求的,CPU是没有过温度墙损坏一说,但临近会主动降频,降频启动的温度上限未公布,而其他配件颗粒民品基本上最高温度温度墙就是85℃,相信MT2500也差不多,不过MT2500没用SPI方案,而是用了大容量EMMC方案,因我手头没有MT2500,所以无法知道glinet原厂MT2500的EMMC是何型号,但有一点可以肯定别的芯片都没问题,而MT2500的EMMC颗粒先劣化扛不住报废致设备变砖,那有MT2500的网友最好开盖看看EMMC型号并上网到生产厂家网站查颗粒数据手册,看看工作温度范围是多少;

    glinet官方2022年11月回复MT2500散热问题的帖子里,厂家贴出的无散热情况下在南方工作12小时后所有芯片最高温度是76℃,最低温也有60℃上下,当然这个测试对于用户环境和弱电箱工作环境7*24小时运行是什么值就不太好说了,另外用户都会装些插件或dock什么的,负载一上来,长期温度怎样更不好说

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    回复

    使用道具 举报

    3

    主题

    16

    帖子

    369

    积分

    中级会员

    Rank: 3Rank: 3

    积分
    369
    发表于 4 天前 | 显示全部楼层
    应该更散热没有过大关系, 我做硬件十几年来,EMMC发热是非常小的, 一般不会增加散热处理, 像电视里面的EMMC 一般使用几年后他有寿命周期    例如 帮朋友扩容电视的EMMC 用设备读取出来是 还显示寿命周期A : 60%-70% 已使用  。通过这一点应该确定跟散热关系不大,我手里也有MT7981B的电路PCB文件,通过对比,应该官方是根据Demo 设计的,包含兼容设计 电阻也都有预留。  应该更UBOOT有很大关系。  具体现在没有设备了没有办法测试了, 不敢妄作评论。
    回复

    使用道具 举报

    3

    主题

    86

    帖子

    1042

    积分

    金牌会员

    Rank: 6Rank: 6

    积分
    1042
     楼主| 发表于 3 天前 | 显示全部楼层
    iotdoc 发表于 2024-11-30 23:40
    应该更散热没有过大关系, 我做硬件十几年来,EMMC发热是非常小的, 一般不会增加散热处理, 像电视里面的E ...

    但当下glinet官方降EMMC工作频率的临时做法(别的厂家MT7981B方案都没降过工作频率)实则就是怀疑EMMC高温劣化失效上,所以降频降低功率,如果你判断的没问题(指不一定是高温劣化问题),那现在官方方案只是临时堵住舆情风口的措施,所以固件也不敢放到稳定版公布,只是在beta区。也许官方现在也是迷惑中,有了应对时间再慢慢解决
    回复

    使用道具 举报

    0

    主题

    41

    帖子

    610

    积分

    超级版主

    Rank: 8Rank: 8

    积分
    610
    发表于 3 天前 | 显示全部楼层
    sunrosefly 发表于 2024-11-30 18:50
    今天变砖了,搜解决方案,就搜到这个帖子,官方固件未刷第三方

    该情况可以到天猫glinet旗舰店联系客服给您安排售后处理解决
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|gl-inet.cn ( 粤ICP备18130956号 )

    GMT+8, 2024-12-4 16:17 , Processed in 0.027697 second(s), 25 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表