[Python] 基于Python制作一个简单的文章搜索工具

1948 1
Honkers 2023-5-13 15:51:03 | 显示全部楼层 |阅读模式
目录

    前言功能实现
      导入模块创建窗口背景图片搜索文本框 内容显示界面搜索内容效果代码展示内容效果代码点击搜索功能代码访问博客网页



前言

今天,我无聊的时候做了一个搜索文章的软件,有没有更加的方便快捷不知道,好玩就行了。基于Python tkinter 制作文章搜索软件,都是一些基础的应用。

功能实现




导入模块

代码
我们首先做到第一件事是导入模块。
import tkinter as tk
import webbrowser
from tkinter import ttk
import requests
创建窗口

代码
root = tk.Tk()
root.title('CSDN问题搜索')
root.geometry('1000x700+100+100')
root.iconbitmap('search.ico')
root.mainloop()这段代码创建了一个名为root的Tkinter窗口对象,并设置了窗口的标题和大小。然后,它使用root.iconbitmap()方法将一个名为search.ico的图标图像设置为窗口的图标。
root.geometry()方法用于设置窗口的位置和大小,它接受一个参数,即窗口的位置和大小。在这个例子中,我们将窗口的位置设置为(1000, 700)并将大小设置为(100, 100)
效果



背景图片

代码
img = tk.PhotoImage(file='benjing.png')
tk.Label(root, image=img).pack()这行代码创建了一个名为img的PhotoImage对象,并将其设置为根窗口对象root的图像。然后,它使用tk.Label创建一个标签对象,并将图像设置为该标签的图像。最后,它使用pack()方法将标签对象放置在根窗口对象中。
效果



搜索文本框

代码
search_frame = tk.Frame(root)
search_frame.pack(pady=12)
# 创建一个字符串变量
search_va = tk.StringVar()
tk.Label(search_frame, text='CSDN搜索', font=('黑体', 12)).pack(side=tk.LEFT, padx=6)
tk.Entry(search_frame, relief='flat', width=30, textvariable=search_va).pack(side=tk.LEFT, padx=5, fill='both')
tk.Button(search_frame, text='C一下', font=('黑体', 12), relief='flat', bg='#fe6b00').pack(side=tk.LEFT, padx=5)这段代码创建了一个名为search_frame的Tkinter窗口对象,并将其放置在根窗口对象root中。然后,它创建了一个StringVar对象search_va,并将其设置为一个字符串变量。接下来,它创建了一个Label对象tk.Label,并将其放置在search_frame中。tk.Label对象具有一个文本属性和一个字体属性,这里使用了一个黑体字体和12号字号。tk.Entry对象具有一个文本属性和一个宽度属性,这里使用了一个30像素的宽度和一个StringVar对象search_va。最后,它创建了一个Button对象tk.Button,并将其放置在search_frame中。tk.Button对象具有一个文本属性、一个字体属性和一个背景属性,这里使用了一个黑体字体、12号字号和一个背景颜色为#fe6b00。
效果



内容显示界面

代码
tree_view = ttk.Treeview(root,show="headings", columns=('num', 'title', 'author', 'date', 'link'))
tree_view.column("num", width=10, anchor='center')
tree_view.column('title', width=200, anchor='w')
tree_view.column('author', width=10, anchor='center')
tree_view.column('date', width=10, anchor='center')
tree_view.column('link', width=150, anchor='center')
tree_view.heading('num', text='序号')
tree_view.heading('title', text='标题')
tree_view.heading('author', text='作者')
tree_view.heading('date', text='发布时间')
tree_view.heading('link', text='链接')
tree_view.pack(fill=tk.BOTH, expand=False, pady=10)这段代码创建了一个名为tree_view的Tkinter Treeview对象,并将根节点设置为root。show参数设置为"headings",表示显示节点的标题。columns参数设置为一个包含节点标题、作者、发布时间和链接的列表。tree_view.column()方法用于设置每个列的宽度和锚点。tree_view.column()方法接受一个参数,即要设置宽度和锚点的列的名称。tree_view.heading()方法用于设置每个列的标题。tree_view.pack()方法用于设置节点的位置和大小,并将节点放置在根窗口对象中。tree_view.fill参数设置为"both",表示填充整个窗口,expand参数设置为True,表示展开节点,pady参数设置为10,表示节点之间的间距。
效果



搜索内容效果代码

到了这里,我们这个框架就写好了,那么,我们如何获取搜索功能呢。、
def search(word):
    search_list = []
    num = 1
    for page in range(1, 3):
        url = 'https://so.csdn.net/api/v3/search'
        data = {
            'q': word,
            'p': page,
        }
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'
        }
        response = requests.get(url=url, params=data, headers=headers)
        for index in response.json()['result_vos']:
            title = index["title"].replace('<em>', '').replace('</em>', '')
            author = index["nickname"].replace('<em>', '').replace('</em>', '')
            dit = {
                'num': num,
                'title': title,
                'author': author,
                'date': index['create_time_str'],
                'link': index['url'],
            }
            num += 1
            search_list.append(dit)
    return search_list
这段代码定义了一个名为search的函数,该函数接受一个字符串参数word,并返回一个字符串列表,其中包含符合给定字符串的所有文档的标题、作者和发布时间。
该函数首先创建一个空字符串列表search_list,然后使用一个循环来搜索所有可能的页面。在每个页面上,它使用requests库发送一个HTTP GET请求,并将搜索参数作为请求的一部分传递。然后,它将响应的JSON数据解析为一个字典,其中包含每个文档的标题、作者和发布时间。然后,它将每个字典添加到search_list中,并将搜索列表的长度增加1。
最后,该函数返回search_list,该列表包含符合给定字符串的所有文档的标题、作者和发布时间。
效果
比如讲,搜索博主“爱吃饼干的小白鼠”,我们看看网站反馈的数据是不是和我们一样的。



展示内容效果代码

接下来,我们就要把上面的内容展示到界面里面。
def show(search_list):
    # 往树状图中插入数据
    for index, li in enumerate(search_list):
        tree_view.insert('', index + 1,values=(li['num'], li['title'], li['author'], li['date'], li['link']))这段代码定义了一个名为show的函数,该函数接受一个字符串列表参数search_list,该列表包含每个文档的标题、作者和发布时间,用于插入树状图中。
该函数首先使用一个循环来遍历search_list,并使用tree_view.insert()方法将每个文档插入到树状图中。tree_view.insert()方法接受一个参数,即要插入的节点的索引和值列表。values参数用于指定节点的值列表。

点击搜索功能代码

上面我们讲述了搜索功能代码,以及展示代码。接下来,我们就要实现这样的功能——我们在文本框输入“爱吃饼干的小白鼠”,然后,我们点击C一下,就会在界面显示内容。
(PS—如果大家感兴趣,可以实现一个回车的功能)
def click():
    key_word = search_va.get()
    if key_word:
        search_list = search(word=key_word)
        show(search_list)这段代码定义了一个名为click的函数,该函数用于查找键盘上输入的字符串。如果找到了相应的字符串,则调用search()函数查找包含该字符串的文档并显示它们。get()方法用于从缓冲区中获取字符串。if key_word语句检查输入字符串是否包含在search_va中,如果是,则将search_list更新为包含相关文档的字符串列表。然后调用show()函数将其显示在树状图中。
效果



访问博客网页

我们接下来,就实现点击某一行就会访问该文章。
def tree_view_click():
    for item in tree_view.selection():
        item_text = tree_view.item(item, "values")
        webbrowser.open(item_text[-1])这段代码定义了一个名为tree_view_click的函数,该函数用于在树状图中选择节点并打开相应的网页。它使用tree_view.selection()方法获取选中的节点,并使用tree_view.item()方法获取节点的文本值。然后,它使用webbrowser.open()方法打开相应的网页。
tree_view.bind("<Button-1>",tree_view_click)在 Python 中,可以使用 tkinter 模块中的 ttk 子模块来创建树形视图控件。要为树形视图添加点击函数,可以使用 ttk.Treeview 的 __init__ 方法来设置点击事件处理函数。
到此这篇关于基于Python制作一个简单的文章搜索工具的文章就介绍到这了,更多相关Python文章搜索工具内容请搜索中国红客联盟以前的文章或继续浏览下面的相关文章希望大家以后多多支持中国红客联盟!
Eorknoy 2023-8-20 11:24:39 | 显示全部楼层
pip install whoosh
from whoosh.fields import Schema, TEXT
from whoosh.index import create_in, open_dir
from whoosh.qparser import QueryParser

def create_index(directory):
    # 定义索引的schema,字段为content
    schema = Schema(content=TEXT(stored=True))

    # 创建索引目录
    if not os.path.exists(directory):
        os.mkdir(directory)

    # 创建索引
    ix = create_in(directory, schema)

    # 获取写入索引的writer
    writer = ix.writer()

    # 遍历目录及子目录下的文件
    for root, dirs, files in os.walk(directory):
        for file in files:
            if file.endswith(".txt"):  # 只处理文本文件
                file_path = os.path.join(root, file)
                with open(file_path, "r", encoding="utf-8") as f:
                    content = f.read()
                    writer.add_document(content=content)

    # 提交写入操作
    writer.commit()

def search_articles(keyword, index_dir):
    # 打开索引目录
    ix = open_dir(index_dir)

    # 创建查询解析器
    qp = QueryParser("content", schema=ix.schema)

    # 解析关键字为查询对象
    query = qp.parse(keyword)

    # 在索引中搜索匹配的文章
    with ix.searcher() as searcher:
        results = searcher.search(query)

        # 返回匹配的文章列表
        return [result["content"] for result in results]

# 示例使用方法
keyword = input("请输入关键字:")
index_dir = input("请输入索引目录:")

# 创建索引(仅需执行一次)
create_index(index_dir)

# 搜索匹配的文章
results = search_articles(keyword, index_dir)

if len(results) == 0:
    print("未找到匹配的文章。")
else:
    print("匹配的文章如下:")
    for result in results:
        print(result)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Honkers

荣誉红客

关注
  • 4008
    主题
  • 36
    粉丝
  • 0
    关注
这家伙很懒,什么都没留下!

中国红客联盟公众号

联系站长QQ:5520533

admin@chnhonker.com
Copyright © 2001-2025 Discuz Team. Powered by Discuz! X3.5 ( 粤ICP备13060014号 )|天天打卡 本站已运行