贝利信息

如何使用Golang下载网络文件_Golang net/http 下载与保存示例

日期:2026-01-03 00:00 / 作者:P粉602998670
用 http.Get 下载文件返回 403 或空内容,主要是因默认 User-Agent 为空被服务器拒绝;需手动设置 User-Agent、检查 StatusCode、用 io.Copy 流式下载并配合临时文件与目录预创建确保健壮性。

http.Get 下载文件时为什么返回 403 或空内容?

很多网站(尤其是 CDN 或静态资源站)会校验 User-Agent,默认的 Go HTTP 客户端请求头里 User-Agent空的,导致服务器拒绝响应。直接调用 http.Get(url) 拿到 *http.Response 后,不检查 resp.StatusCode 就写文件,很容易保存一个 0 字节或 HTML 错误页。

实操建议:

立即学习“go语言免费学习笔记(深入)”;

如何用 io.Copy 安全保存大文件?

io.Copy 是 Go 标准库推荐的流式复制方式,内部使用固定大小缓冲区(默认 32KB),不会把整个文件加载进内存。但要注意:如果目标路径目录不存在,os.Create 会失败;如果磁盘满或权限不足,io.Copy 返回错误但不会自动清理已写入的碎片文件。

实操建议:

立即学习“go语言免费学习笔记(深入)”;

带进度显示的下载要怎么加?

Go 原生没有内置进度回调,得自己包装 resp.Body 实现 io.ReadCloser,并在每次 Read 时更新计数器。注意:不能简单用 Content-Length 判断总大小——有些服务不返回该 header,或用分块传输(chunked encoding)时值为 -1。

实操建议:

立即学习“go语言免费学习笔记(深入)”;

package main

import ( "fmt" "io" "net/http" "os" "path/filepath" "time" )

func downloadFile(url, filename string) error { req, err := http.NewRequest("GET", url, nil) if err != nil { return err } req.Header.Set("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36")

client := &http.Client{Timeout: 30 * time.Second}
resp, err := client.Do(req)
if err != nil {
    return err
}
defer resp.Body.Close()

if resp.StatusCode != 200 {
    return fmt.Errorf("HTTP %d: %s", resp.StatusCode, resp.Status)
}

dir := filepath.Dir(filename)
if dir != "." {
    os.MkdirAll(dir, 0755)
}

tmpFile, err := os.CreateTemp(dir, "download-*.tmp")
if err != nil {
    return err
}
defer os.Remove(tmpFile.Name()) // 清理临时文件(仅当失败时)

n, err := io.Copy(tmpFile, resp.Body)
if err != nil {
    return err
}

if err := tmpFile.Close(); err != nil {
    return err
}

if err := os.Rename(tmpFile.Name(), filename); err != nil {
    return err
}

fmt.Printf("Downloaded %s (%d bytes)\n", filename, n)
return nil

}

func main() { err := downloadFile("https://www./link/1e2abba2db0a741cf5f8cebd33605a07", "./downloads/image.jpg") if err != nil { fmt.Printf("Error: %v\n", err) } }

Go 的 HTTP 下载看似简单,但真正稳定落地时,User-Agent、临时文件策略、Content-Length 缺失处理、以及错误路径下的资源清理,这几处最容易被跳过。