You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

storage_load_package.go 15 kB

1 year ago
1 year ago
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454
  1. package task
  2. import (
  3. "fmt"
  4. "io"
  5. "math"
  6. "os"
  7. "path/filepath"
  8. "time"
  9. "github.com/samber/lo"
  10. "gitlink.org.cn/cloudream/common/pkgs/bitmap"
  11. "gitlink.org.cn/cloudream/common/pkgs/ipfs"
  12. "gitlink.org.cn/cloudream/common/pkgs/task"
  13. cdssdk "gitlink.org.cn/cloudream/common/sdks/storage"
  14. "gitlink.org.cn/cloudream/common/utils/io2"
  15. myref "gitlink.org.cn/cloudream/common/utils/reflect"
  16. "gitlink.org.cn/cloudream/common/utils/sort2"
  17. "gitlink.org.cn/cloudream/storage/common/consts"
  18. stgglb "gitlink.org.cn/cloudream/storage/common/globals"
  19. stgmod "gitlink.org.cn/cloudream/storage/common/models"
  20. "gitlink.org.cn/cloudream/storage/common/pkgs/distlock/reqbuilder"
  21. "gitlink.org.cn/cloudream/storage/common/pkgs/ec"
  22. coormq "gitlink.org.cn/cloudream/storage/common/pkgs/mq/coordinator"
  23. "gitlink.org.cn/cloudream/storage/common/utils"
  24. )
  25. // StorageLoadPackage 定义了存储加载包的结构体,包含完整的输出路径和与存储、包、用户相关的ID。
  26. type StorageLoadPackage struct {
  27. FullOutputPath string
  28. userID cdssdk.UserID
  29. packageID cdssdk.PackageID
  30. storageID cdssdk.StorageID
  31. pinnedBlocks []stgmod.ObjectBlock
  32. }
  33. // NewStorageLoadPackage 创建一个新的StorageLoadPackage实例。
  34. // userID: 用户ID。
  35. // packageID: 包ID。
  36. // storageID: 存储ID。
  37. // 返回一个新的StorageLoadPackage指针。
  38. func NewStorageLoadPackage(userID cdssdk.UserID, packageID cdssdk.PackageID, storageID cdssdk.StorageID) *StorageLoadPackage {
  39. return &StorageLoadPackage{
  40. userID: userID,
  41. packageID: packageID,
  42. storageID: storageID,
  43. }
  44. }
  45. // Execute 执行存储加载任务。
  46. // task: 任务实例。
  47. // ctx: 任务上下文。
  48. // complete: 完成回调函数。
  49. // 无返回值。
  50. func (t *StorageLoadPackage) Execute(task *task.Task[TaskContext], ctx TaskContext, complete CompleteFn) {
  51. err := t.do(task, ctx)
  52. complete(err, CompleteOption{
  53. RemovingDelay: time.Minute,
  54. })
  55. }
  56. // do 实际执行存储加载的过程。
  57. // task: 任务实例。
  58. // ctx: 任务上下文。
  59. // 返回执行过程中可能出现的错误。
  60. func (t *StorageLoadPackage) do(task *task.Task[TaskContext], ctx TaskContext) error {
  61. // 获取协调器客户端
  62. coorCli, err := stgglb.CoordinatorMQPool.Acquire()
  63. if err != nil {
  64. return fmt.Errorf("new coordinator client: %w", err)
  65. }
  66. defer stgglb.CoordinatorMQPool.Release(coorCli)
  67. // 获取IPFS客户端
  68. ipfsCli, err := stgglb.IPFSPool.Acquire()
  69. if err != nil {
  70. return fmt.Errorf("new IPFS client: %w", err)
  71. }
  72. defer stgglb.IPFSPool.Release(ipfsCli)
  73. // 从协调器获取存储信息
  74. getStgResp, err := coorCli.GetStorageInfo(coormq.NewGetStorageInfo(t.userID, t.storageID))
  75. if err != nil {
  76. return fmt.Errorf("request to coordinator: %w", err)
  77. }
  78. // 构造输出目录路径并创建该目录
  79. outputDirPath := utils.MakeStorageLoadPackagePath(getStgResp.Directory, t.userID, t.packageID)
  80. if err = os.MkdirAll(outputDirPath, 0755); err != nil {
  81. return fmt.Errorf("creating output directory: %w", err)
  82. }
  83. t.FullOutputPath = outputDirPath
  84. getObjectDetails, err := coorCli.GetPackageObjectDetails(coormq.ReqGetPackageObjectDetails(t.packageID))
  85. if err != nil {
  86. return fmt.Errorf("getting package object details: %w", err)
  87. }
  88. // 获取互斥锁以确保并发安全
  89. mutex, err := reqbuilder.NewBuilder().
  90. // 提前占位
  91. Metadata().StoragePackage().CreateOne(t.userID, t.storageID, t.packageID).
  92. // 保护在storage目录中下载的文件
  93. Storage().Buzy(t.storageID).
  94. // 保护下载文件时同时保存到IPFS的文件
  95. IPFS().Buzy(getStgResp.NodeID).
  96. MutexLock(ctx.distlock)
  97. if err != nil {
  98. return fmt.Errorf("acquire locks failed, err: %w", err)
  99. }
  100. defer mutex.Unlock()
  101. // 下载每个对象
  102. for _, obj := range getObjectDetails.Objects {
  103. err := t.downloadOne(coorCli, ipfsCli, outputDirPath, obj)
  104. if err != nil {
  105. return err
  106. }
  107. }
  108. // 通知协调器包已加载到存储
  109. _, err = coorCli.StoragePackageLoaded(coormq.NewStoragePackageLoaded(t.userID, t.storageID, t.packageID, t.pinnedBlocks))
  110. if err != nil {
  111. return fmt.Errorf("loading package to storage: %w", err)
  112. }
  113. // TODO 要防止下载的临时文件被删除
  114. return err
  115. }
  116. // downloadOne 用于下载一种特定冗余类型的对象。
  117. //
  118. // 参数:
  119. // - coorCli: 协调客户端,用于与CDN协调器进行通信。
  120. // - ipfsCli: IPFS池客户端,用于与IPFS网络进行交互。
  121. // - dir: 下载对象的目标目录。
  122. // - obj: 要下载的对象详细信息,包括对象路径和冗余类型等。
  123. //
  124. // 返回值:
  125. // - error: 下载过程中遇到的任何错误。
  126. func (t *StorageLoadPackage) downloadOne(coorCli *coormq.Client, ipfsCli *ipfs.PoolClient, dir string, obj stgmod.ObjectDetail) error {
  127. var file io.ReadCloser
  128. // 根据对象的冗余类型选择不同的下载策略。
  129. switch red := obj.Object.Redundancy.(type) {
  130. case *cdssdk.NoneRedundancy:
  131. // 无冗余或复制冗余对象的下载处理。
  132. reader, err := t.downloadNoneOrRepObject(ipfsCli, obj)
  133. if err != nil {
  134. return fmt.Errorf("downloading object: %w", err)
  135. }
  136. file = reader
  137. case *cdssdk.RepRedundancy:
  138. // 复制冗余对象的下载处理。
  139. reader, err := t.downloadNoneOrRepObject(ipfsCli, obj)
  140. if err != nil {
  141. return fmt.Errorf("downloading rep object: %w", err)
  142. }
  143. file = reader
  144. case *cdssdk.ECRedundancy:
  145. // 前向纠错冗余对象的下载处理。
  146. reader, pinnedBlocks, err := t.downloadECObject(coorCli, ipfsCli, obj, red)
  147. if err != nil {
  148. return fmt.Errorf("downloading ec object: %w", err)
  149. }
  150. file = reader
  151. t.pinnedBlocks = append(t.pinnedBlocks, pinnedBlocks...)
  152. default:
  153. // 遇到未知的冗余类型返回错误。
  154. return fmt.Errorf("unknow redundancy type: %v", myref.TypeOfValue(obj.Object.Redundancy))
  155. }
  156. defer file.Close() // 确保文件在函数返回前被关闭。
  157. // 拼接完整的文件路径,并创建包含该文件的目录。
  158. fullPath := filepath.Join(dir, obj.Object.Path)
  159. lastDirPath := filepath.Dir(fullPath)
  160. if err := os.MkdirAll(lastDirPath, 0755); err != nil {
  161. return fmt.Errorf("creating object last dir: %w", err)
  162. }
  163. // 创建输出文件。
  164. outputFile, err := os.Create(fullPath)
  165. if err != nil {
  166. return fmt.Errorf("creating object file: %w", err)
  167. }
  168. defer outputFile.Close() // 确保文件在函数返回前被关闭。
  169. // 将下载的内容写入本地文件。
  170. if _, err := io.Copy(outputFile, file); err != nil {
  171. return fmt.Errorf("writting object to file: %w", err)
  172. }
  173. return nil
  174. }
  175. // downloadNoneOrRepObject 用于下载没有冗余或需要从IPFS网络中检索的对象。
  176. // 如果对象不存在于任何节点上,则返回错误。
  177. //
  178. // 参数:
  179. // - ipfsCli: IPFS客户端池的指针,用于与IPFS网络交互。
  180. // - obj: 要下载的对象的详细信息。
  181. //
  182. // 返回值:
  183. // - io.ReadCloser: 下载文件的读取器。
  184. // - error: 如果下载过程中出现错误,则返回错误信息。
  185. func (t *StorageLoadPackage) downloadNoneOrRepObject(ipfsCli *ipfs.PoolClient, obj stgmod.ObjectDetail) (io.ReadCloser, error) {
  186. if len(obj.Blocks) == 0 && len(obj.PinnedAt) == 0 {
  187. return nil, fmt.Errorf("no node has this object")
  188. }
  189. // 将对象文件哈希添加到本地Pin列表,无论是否真正需要
  190. ipfsCli.Pin(obj.Object.FileHash)
  191. // 尝试打开并读取对象文件
  192. file, err := ipfsCli.OpenRead(obj.Object.FileHash)
  193. if err != nil {
  194. return nil, err
  195. }
  196. return file, nil
  197. }
  198. // downloadECObject 用于下载采用EC(Erasure Coding)编码的对象。
  199. // 该方法会根据对象的块信息和EC冗余策略,从网络中下载必要的数据块并恢复整个对象。
  200. //
  201. // 参数:
  202. // - coorCli: 协调器客户端的指针,用于节点间的协调与通信。
  203. // - ipfsCli: IPFS客户端池的指针,用于与IPFS网络交互。
  204. // - obj: 要下载的对象的详细信息。
  205. // - ecRed: EC冗余策略的详细配置。
  206. //
  207. // 返回值:
  208. // - io.ReadCloser: 恢复后的对象文件的读取器。
  209. // - []stgmod.ObjectBlock: 被Pin住的对象块列表。
  210. // - error: 如果下载或恢复过程中出现错误,则返回错误信息。
  211. func (t *StorageLoadPackage) downloadECObject(coorCli *coormq.Client, ipfsCli *ipfs.PoolClient, obj stgmod.ObjectDetail, ecRed *cdssdk.ECRedundancy) (io.ReadCloser, []stgmod.ObjectBlock, error) {
  212. // 根据对象信息和节点状态,排序选择最优的下载节点
  213. allNodes, err := t.sortDownloadNodes(coorCli, obj)
  214. if err != nil {
  215. return nil, nil, err
  216. }
  217. // 计算最小读取块解决方案和最小读取对象解决方案
  218. bsc, blocks := t.getMinReadingBlockSolution(allNodes, ecRed.K)
  219. osc, _ := t.getMinReadingObjectSolution(allNodes, ecRed.K)
  220. // 如果通过块恢复更高效,则执行块恢复流程
  221. if bsc < osc {
  222. var fileStrs []io.ReadCloser
  223. rs, err := ec.NewStreamRs(ecRed.K, ecRed.N, ecRed.ChunkSize)
  224. if err != nil {
  225. return nil, nil, fmt.Errorf("new rs: %w", err)
  226. }
  227. // 为每个需要读取的块执行Pin操作和打开读取流
  228. for i := range blocks {
  229. ipfsCli.Pin(blocks[i].Block.FileHash)
  230. str, err := ipfsCli.OpenRead(blocks[i].Block.FileHash)
  231. if err != nil {
  232. for i -= 1; i >= 0; i-- {
  233. fileStrs[i].Close()
  234. }
  235. return nil, nil, fmt.Errorf("donwloading file: %w", err)
  236. }
  237. fileStrs = append(fileStrs, str)
  238. }
  239. fileReaders, filesCloser := io2.ToReaders(fileStrs)
  240. // 准备恢复数据所需的信息和变量
  241. var indexes []int
  242. var pinnedBlocks []stgmod.ObjectBlock
  243. for _, b := range blocks {
  244. indexes = append(indexes, b.Block.Index)
  245. pinnedBlocks = append(pinnedBlocks, stgmod.ObjectBlock{
  246. ObjectID: b.Block.ObjectID,
  247. Index: b.Block.Index,
  248. NodeID: *stgglb.Local.NodeID,
  249. FileHash: b.Block.FileHash,
  250. })
  251. }
  252. outputs, outputsCloser := io2.ToReaders(rs.ReconstructData(fileReaders, indexes))
  253. return io2.AfterReadClosed(io2.Length(io2.ChunkedJoin(outputs, int(ecRed.ChunkSize)), obj.Object.Size), func(c io.ReadCloser) {
  254. filesCloser()
  255. outputsCloser()
  256. }), pinnedBlocks, nil
  257. }
  258. // 如果通过对象恢复更高效或没有足够的块来恢复文件,则直接尝试读取对象文件
  259. if osc == math.MaxFloat64 {
  260. return nil, nil, fmt.Errorf("no enough blocks to reconstruct the file, want %d, get only %d", ecRed.K, len(blocks))
  261. }
  262. str, err := ipfsCli.OpenRead(obj.Object.FileHash)
  263. return str, nil, err
  264. }
  265. type downloadNodeInfo struct {
  266. Node cdssdk.Node
  267. ObjectPinned bool
  268. Blocks []stgmod.ObjectBlock
  269. Distance float64
  270. }
  271. // sortDownloadNodes 对存储对象的下载节点进行排序
  272. // 参数:
  273. // - coorCli *coormq.Client: 协调器客户端,用于获取节点信息
  274. // - obj stgmod.ObjectDetail: 存储对象的详细信息,包含固定存储节点和数据块信息
  275. // 返回值:
  276. // - []*downloadNodeInfo: 排序后的下载节点信息数组
  277. // - error: 如果过程中发生错误,则返回错误信息
  278. func (t *StorageLoadPackage) sortDownloadNodes(coorCli *coormq.Client, obj stgmod.ObjectDetail) ([]*downloadNodeInfo, error) {
  279. // 收集对象的固定存储节点ID和数据块所在节点ID
  280. var nodeIDs []cdssdk.NodeID
  281. for _, id := range obj.PinnedAt {
  282. if !lo.Contains(nodeIDs, id) {
  283. nodeIDs = append(nodeIDs, id)
  284. }
  285. }
  286. for _, b := range obj.Blocks {
  287. if !lo.Contains(nodeIDs, b.NodeID) {
  288. nodeIDs = append(nodeIDs, b.NodeID)
  289. }
  290. }
  291. // 获取节点信息
  292. getNodes, err := coorCli.GetNodes(coormq.NewGetNodes(nodeIDs))
  293. if err != nil {
  294. return nil, fmt.Errorf("getting nodes: %w", err)
  295. }
  296. // 建立下载节点信息的映射表
  297. downloadNodeMap := make(map[cdssdk.NodeID]*downloadNodeInfo)
  298. for _, id := range obj.PinnedAt {
  299. node, ok := downloadNodeMap[id]
  300. if !ok {
  301. mod := *getNodes.GetNode(id)
  302. node = &downloadNodeInfo{
  303. Node: mod,
  304. ObjectPinned: true,
  305. Distance: t.getNodeDistance(mod),
  306. }
  307. downloadNodeMap[id] = node
  308. }
  309. node.ObjectPinned = true // 标记为固定存储对象
  310. }
  311. // 为每个数据块所在节点填充信息,并收集到映射表中
  312. for _, b := range obj.Blocks {
  313. node, ok := downloadNodeMap[b.NodeID]
  314. if !ok {
  315. mod := *getNodes.GetNode(b.NodeID)
  316. node = &downloadNodeInfo{
  317. Node: mod,
  318. Distance: t.getNodeDistance(mod),
  319. }
  320. downloadNodeMap[b.NodeID] = node
  321. }
  322. node.Blocks = append(node.Blocks, b) // 添加数据块信息
  323. }
  324. // 根据节点与存储对象的距离进行排序
  325. return sort2.Sort(lo.Values(downloadNodeMap), func(left, right *downloadNodeInfo) int {
  326. return sort2.Cmp(left.Distance, right.Distance)
  327. }), nil
  328. }
  329. type downloadBlock struct {
  330. Node cdssdk.Node
  331. Block stgmod.ObjectBlock
  332. }
  333. // getMinReadingBlockSolution 获取最小读取区块解决方案
  334. // sortedNodes: 已排序的节点信息列表,每个节点包含多个区块信息
  335. // k: 需要获取的区块数量
  336. // 返回值: 返回获取到的区块的总距离和区块列表
  337. func (t *StorageLoadPackage) getMinReadingBlockSolution(sortedNodes []*downloadNodeInfo, k int) (float64, []downloadBlock) {
  338. // 初始化已获取区块的bitmap和距离
  339. gotBlocksMap := bitmap.Bitmap64(0)
  340. var gotBlocks []downloadBlock
  341. dist := float64(0.0)
  342. // 遍历所有节点及其区块,直到获取到k个不同的区块
  343. for _, n := range sortedNodes {
  344. for _, b := range n.Blocks {
  345. // 如果区块未被获取,则添加到列表中,并更新距离
  346. if !gotBlocksMap.Get(b.Index) {
  347. gotBlocks = append(gotBlocks, downloadBlock{
  348. Node: n.Node,
  349. Block: b,
  350. })
  351. gotBlocksMap.Set(b.Index, true)
  352. dist += n.Distance
  353. }
  354. // 如果已获取的区块数量达到k,返回结果
  355. if len(gotBlocks) >= k {
  356. return dist, gotBlocks
  357. }
  358. }
  359. }
  360. // 如果无法获取到k个不同的区块,返回最大距离和空的区块列表
  361. return math.MaxFloat64, gotBlocks
  362. }
  363. // getMinReadingObjectSolution 获取最小读取对象解决方案
  364. // sortedNodes: 已排序的节点信息列表,每个节点包含一个对象是否被固定的信息
  365. // k: 需要获取的对象数量
  366. // 返回值: 返回获取对象的最小距离和对应的节点
  367. func (t *StorageLoadPackage) getMinReadingObjectSolution(sortedNodes []*downloadNodeInfo, k int) (float64, *cdssdk.Node) {
  368. dist := math.MaxFloat64
  369. var downloadNode *cdssdk.Node
  370. // 遍历节点,寻找距离最小且对象被固定的节点
  371. for _, n := range sortedNodes {
  372. if n.ObjectPinned && float64(k)*n.Distance < dist {
  373. dist = float64(k) * n.Distance
  374. downloadNode = &n.Node
  375. }
  376. }
  377. return dist, downloadNode
  378. }
  379. // getNodeDistance 获取节点距离
  380. // node: 需要计算距离的节点
  381. // 返回值: 返回节点与当前节点或位置的距离
  382. func (t *StorageLoadPackage) getNodeDistance(node cdssdk.Node) float64 {
  383. // 如果有本地节点ID且与目标节点ID相同,返回同一节点距离
  384. if stgglb.Local.NodeID != nil {
  385. if node.NodeID == *stgglb.Local.NodeID {
  386. return consts.NodeDistanceSameNode
  387. }
  388. }
  389. // 如果节点位置与本地位置相同,返回同一位置距离
  390. if node.LocationID == stgglb.Local.LocationID {
  391. return consts.NodeDistanceSameLocation
  392. }
  393. // 默认返回其他距离
  394. return consts.NodeDistanceOther
  395. }

本项目旨在将云际存储公共基础设施化,使个人及企业可低门槛使用高效的云际存储服务(安装开箱即用云际存储客户端即可,无需关注其他组件的部署),同时支持用户灵活便捷定制云际存储的功能细节。