所有栏目 | 云社区 美国云服务器[国内云主机商]
你的位置:首页 > 云社区 » 正文

大型新闻站点或者社区论坛类网站,文本内容都是怎么存储的?

发布时间:2020-04-15 16:48:09

资讯分类:社区论坛  文本  站点  分表  文件  静态  文章
大型新闻站点或者社区论坛类网站,文本内容都是怎么存储的?

文章的数据是要存储在数据库中的,并且要规划好数据格式(表字段),比如:文章标题、简介、正文等等。

图片文件一般是以文件形式存储在网站对应目录中的,但图片的信息一般是保存在“附件表”中的,附件表需要与文章表建立对应关系,这样便于附件的管理,比如:查询某篇文章包含的图片,删除某篇文章同时删除对应的附件等等。

随着信息量的增加,数据库固然增大。但是可以通过缓存或生成静态文件减少对数据库的访问,以减轻数据压力。但并不是所有信息都需要缓存或生成静态文件的,因为你要知道大量碎小文件对磁盘同样是构成压力的。这时候你需要权衡利弊,根据实际情况采用不同的方法,比如:你可以把访问量高的文章以静态文件的方式存在磁盘上,或者根据信息的时效性,把最近一个月的文章生成静态文件,清理掉过期的静态文件 等等...

大型新闻站点或者社区论坛类网站,文本内容都是怎么存储的?

现在都有大数据存储和查询方案了,开源的有HDFS+Hive+HBase,搜索方案ElasticSearch,上到亿级,十亿百亿都不是用MySQL的,像淘宝天猫,头条都可能是自己开发实现的大数据存储

留言与评论(共有 0 条评论)
   
验证码:
Top