This website requires Javascript to function properly. Please go to the setting of your web browser and enable Javascript for this website.
×
Loading...
@Houston
Mall
Forum (EN)
Groups
Blogs
Topic
Panel View
Tree View
Close
Home
Refresh
Share
Sign In/Sign Up
Mall
Forum (English)
Blogs
Groups
Polls
Rolia Radio
工作学习
/
学科技术
/
专业角度解释分坛和移贴的必要性
-
maxwelldone
(麦克斯韦);
2023-6-23
{796}
(#15507686@0)
+2
从啥专业角度来分析的?
-
winterfish
(潜水鱼(\ (•◡•) /));
2023-6-23
(#15507694@0)
+1
RDBMS
-
maxwelldone
(麦克斯韦);
2023-6-23
(#15507702@0)
+1
科技是为人的 needs 服务的。分享不是事,是各个 ego 间的碰撞,强烈碰撞,产生了巨大的非分享型流量。
-
troyd
(老陈);
2023-6-23
(#15507701@0)
+1
老陈是从心理和社会学层面进一步丰富
-
maxwelldone
(麦克斯韦);
2023-6-23
(#15507704@0)
My ego. 😂
-
troyd
(老陈);
2023-6-23
(#15507724@0)
也得到极大丰富
-
maxwelldone
(麦克斯韦);
2023-6-23
(#15507743@0)
技术是为客户体验服务的。
-
897102
(路人甲的假马甲);
2023-6-23
(#15507736@0)
+1
对也不全对。技术不是万能的,也不是孤立的。网站需要在技术,某个人和大多数人的用户体验,运营成本,人力投入等多方面找平衡点。举个例,可能数据库和服务器升级到ChatGPT 那么大的后台,那就论坛随便放。但是对肉联来说,不现实。
-
maxwelldone
(麦克斯韦);
2023-6-23
(#15507741@0)
+1
如果每秒增加一条回复,40字,一个小时3600*40,每天18小时繁忙时间,一年365天,总共365*18*40*3600=946M,大概1G的数据,我觉的没有必要分库分表。
-
sxffff
(lookingforjob);
2023-6-26
(#15515228@0)
+1
一条记录不止40字节。
-
programmer2017
(zzz);
2023-6-26
(#15515268@0)
你这条不到40
-
sxffff
(lookingforjob);
2023-6-26
(#15515424@0)
記錄裏包含各種ID,時間戳,你沒算進去。
-
programmer2017
(zzz);
2023-6-26
(#15515436@0)
+1
好,增加10倍400个字节,10.G也远远不到分库分表,索引做好了,一点问题都没有
-
sxffff
(lookingforjob);
2023-6-26
(#15515447@0)
我覺的兩張表殼可能夠,當前表和歷史表。要算的話就是一年能產生多少條記錄。假如是20 MILLION,有沒有辦法做到快速的索引。多個表就沒有這方面的考慮。
-
programmer2017
(zzz);
2023-6-26
(#15515455@0)
什么叫快速的索引,几个TB的表一样索引,在生产线上的表都是几百个billions of records
-
sxffff
(lookingforjob);
2023-6-26
(#15515495@0)
哪一條生產綫上能有幾百個BILLIONS records? 你確認這幾百個BILLIONS RECORD 是放在一張表格裏嗎? 你不覺的LZ 知道ROLIA 論壇數據庫表格結構嗎?
-
programmer2017
(zzz);
2023-6-26
(#15515525@0)
天天看着这些表,如果rolia的表设计的不是最好的,导致现有的数据增长会增加infrastructure 的支出,这个可以理解,解决方案也有很多种,但是楼主说的是通用网站设计,这个就不一样了,象知乎这种网站,也要这么设计吗?
-
sxffff
(lookingforjob);
2023-6-26
(#15515564@0)
這個例子好。有可能書庫系統本身就有辦法做到一張邏輯表可以存儲幾個BILLIION 的記錄,不影響查詢, 但是硬件了?
-
programmer2017
(zzz);
2023-6-26
(#15515589@0)
这个是国内面试必问问题
-
sxffff
(lookingforjob);
2023-6-26
(#15515636@0)
這邊面試不會這個樣子,就是問寫數據庫的一些基本概念。工作中很少有機會碰到海量的數據,几十個MILLION 數據在一張表裏已經很大的。
-
programmer2017
(zzz);
2023-6-27
(#15516289@0)
事实上就是一个坛如果足够贴多,
它会从一个3NF隐性存在于某个field一个以上的关系造成塌陷成1NF,所以分坛的目的其实和1NF拆分成3NF的过程。这是个信息论的经典问题,当数据足够大,entropy就会足够小,当entropy足够小,必然会有key产生,这个时候RDBMS会从3NF塌陷成1NF就需要拆分了。
-
zhengy4
(尼尼尼);
2023-6-26
{235}
(#15515132@0)
+2
一个字段而已 想多了
-
facenorthface
(小北);
2023-6-26
(#15515444@0)
+1
真的假的,第一次听说网页加载性能提升靠手动, 而不是靠算法和设计实现
-
opulus
(opulus);
2023-6-26
(#15515457@0)
+2
那从专业角度讲,是不是少几个表/论坛速度更快,有很多分论坛内容都有交叉,最好重新分类,精简一下
-
**🍗
;
2023-6-26
(#15515504@0)
表越少平均每个表的数据量就越大,遍历/搜索时间越长;表多虽可分担负荷,但表过多同样耗资源,需找到一个平衡点。当然,论坛毕竟是租用的服务器和空间,受服务商的平台条件制约,若不差钱换更好的平台+全面升级系统,很多问题就解决了,但不就是差钱和老大孤独单干么?
-
see1see
(Isee);
2023-6-26
(#15515523@0)
论坛的历史数据量已积累到某个级别了,搜索操作越来越耗时耗资源,也牵制/影响了当前操作响应速度,老大为解决这个问题,刚刚才折腾了搜索功能,将查询范围缩小限定于半年内,是为改善/维持响应速度和防止系统崩溃?但估计也只是权宜之计…
-
see1see
(Isee);
2023-6-26
(#15515509@0)
谢版主加✴️, 谢各位大侠参与讨论🤝。不一一回复了。我是估摸着写的,疏漏在所难免,毕竟后台也看不见。猜测时考虑了肉联的历史,infrastructure 是二十年前的。感觉老大不易,选论坛发帖的时候大家多花一秒钟选择合适的论坛总没什么坏处。
-
maxwelldone
(麦克斯韦);
2023-6-27
(#15518111@0)
以后老大用AI机器人帮忙挪贴,不就省事了?
-
pumba
(乱弹后半生);
2023-6-27
(#15518216@0)
Share
More Topics
Torvalds patch improves Linux performance by 2.6%
GitHub Spark
脑洞大开,突发奇想,用力来传播信息
看大家讨论日语,俺也正在认真学习。其实语言问题应该是很快也很容易就解决的,可能比自动驾驶来的还快。TREK里面,全宇宙的人都在大脑里安装了UNIVERSAL TRANSLATOR,外星人之间相互交流无障碍。废话少说,看视频。。。加上个MIC和耳机,不同国家的人就可以无障碍交流。
肉脸真有搞 IT 的?Linux 把俄国中国伊朗踢出去了好像肉脸 IT 没啥感觉似的
枫下论坛主坛
/
工作学习
/
学科技术