“南开博客聚能”需求分析文档
Contents
“南开博客聚能”是我今天晚上突然冒出来的想法,旨在联合全南开博客网友的实力,推广南开博客文化,鼓励更多网友更新自己的博客,以下是我胡乱写的需求分析。 “南开博客聚能”需求分析文档 一、引言: 编写目的: 为明确软件需求、安排项目规划与进度、组织软件开发与测试,撰写本文档。本文档供项目经理、设计人员、开发人员参考。 二、概述: “南开博客聚能”是面向南开大学在校学生以及校友的blog编写的免费网络产品,它的宗旨是通过整合这些blog的内容,宣传和推广各个blog。 1.背景: 用户:所有希望宣传和推广自己blog站点的南开大学在校学生以及校友等网友。 技术:基于PHP5+Sqlite或PHP+MySQL开发。 开发周期:1-2周。 2. 目标: 本系统所实现的功能将是利用程序的智能算法,利用各种数据,将各个blog的最新内容整合到一起。 (1)建立查询网站,支持并发访问 (2)可提供面向所有客户的基于HTML和RSS等格式的实用信息 (3)提高数据读取效率 (4)建立多个镜像发布点,规避网络风险,保证数据传输稳定 (5)能随时根据站点数量和内容的变化实现更新和扩展 (6)发布的信息能够鼓励blog作者经常更新自己的站点,能够产生实际的宣传效果 3. 运行模式: 面向用户,在浏览器中直接返回相关数据,包括最新日志和站点信息。 本系统被期望布署为一个数据发布系统和多个数据镜像发布系统,要求有较高可靠性和稳定性。 三、数据描述: blog最近更新信息,包括站点名称以及日志标题。 四、功能需求: 1.功能划分: (1)各站点获取数据。 (2)服务器端定期抓取各站点RSS源。 (3)服务器端对抓取到的RSS数据进行分析整合,更新至数据库。 (4)站点提交及管理功能。 (5)各项统计功能。 2.功能描述: 1)各站点获取数据: 在联盟网站的页面内以的方式嵌入Javascript脚本即可。 2)服务器端定期抓取各站点RSS源: 在服务器上定时运行抓取程序,供数据分析程序用。 3)服务器端对抓取到的RSS数据进行分析整合,更新至数据库: 算法设计: I、 抽取所有RSS源中的相关字段的数据,并过滤恶意和无效记录: a) 若同一RSS源内任意相邻两篇blog的发表时间间隔小于5分钟,则整个RSS源被判无效,并将该站点的违规记录加一; b) 若同一RSS源内最近一小时发表的blog大于等于3篇,则仅取最新的3篇blog。 II、 将过滤后的数据更新至数据库。 III、 对数据库中各记录按时间实施排序,取出前若干条记录。 IV、 更新计数: a) 某站点显示一次该服务提供的信息,该站点对应的主动显示记录计数加一,信息中各站点的被动显示记录加一,10s内重复刷新无效; b) 某站点或其日志在该服务提供的信息中被点击一次,承载信息的站点对应的主动点击记录加一,被点击的站点对应的被动点击记录加一,60s内重复点击无效。 4)后台管理: I、 用户提交一个站点 a) 网友在页面提交自己的电子邮件地址、blog站点的RSS地址、站长的联系方式,随后一封确认信件将被寄至信箱; b) 网友点击信箱中的链接完成注册。 II、 用户修改自己的站点 a) 网友在页面提交自己的电子邮件地址,随后一封确认信件将被寄至信箱; b) 网友点击信箱中的链接,会出现修改界面,提交即可完成修改。 III、 管理员添加、修改、删除一个站点 a) 需要的信息:站点的RSS地址,站长的联系方式。 IV、 管理员查看最近日志 a) 最近的各项积分增长记录; b) 最近的违规记录; c) 若干天内未尽发布信息义务的站点列表。 5)各项统计功能: I、 南开博客聚能站点排行榜,该排行榜是由站点近若干日各项积分乘以各自的权重并求和而得。 II、 南开博客聚能系统总显示数量,总被点击次数等等。
Author
LastMod 2004-11-15