请问train.py里168行partial_index的作用？ #4

zhishao · 2023-11-29T12:46:57Z

按照代码中的逻辑，partial_index应该每次都为从0到num_classes的列表，我不明白这有何作用？

zhishao · 2023-11-30T08:01:07Z

感觉代码不像是最终代码，尤其是损失函数那块

Jason-Zhou-JC · 2023-12-02T08:45:20Z

partial_index 是为了超参数 r 而使用的，你可以在不同 r 的配置下打印出来看看就知道区别了。代码也是完整的，按照说明执行操作就可以训练得到跟论文里相似的结果。

zhishao · 2023-12-04T02:41:35Z

非常感谢您的回复，看这段代码时感觉很像partial FC，故有此问。您工程中的示例代码我看到是单个GPU运行的，请问后续有多GPU运行，或者结合partial FC的示例代码放出吗？

zhishao · 2023-12-10T05:03:14Z

代码中Normalized_BCE_Loss和Unified_Cross_Entropy_Loss是一样的，请问是为什么？并且我在其他任务上训练发现效果不如arcface，请问您有什么改进建议呢？@Jason-Zhou-JC

Jason-Zhou-JC · 2023-12-12T07:03:18Z

暂时没有多GPU的计划，可能得晚一点。单GPU除了训练时间久点，没有什么问题，通过超参 bs_mul 的设置也可以模拟更大 batch size 的情况。Normalized_BCE_Loss和Unified_Cross_Entropy_Loss你看仔细点还是不一样的，bias的数量不一样。其他任务上的训练具体什么情况我不清楚，可能你换个超参数调一下就好了，也可能它根本就不适用。

Jason-Zhou-JC · 2023-12-13T08:05:27Z

已更新DataParallel代码。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问train.py里168行partial_index的作用？ #4

请问train.py里168行partial_index的作用？ #4

zhishao commented Nov 29, 2023

zhishao commented Nov 30, 2023

Jason-Zhou-JC commented Dec 2, 2023 •

edited

Loading

zhishao commented Dec 4, 2023

zhishao commented Dec 10, 2023

Jason-Zhou-JC commented Dec 12, 2023 •

edited

Loading

Jason-Zhou-JC commented Dec 13, 2023

请问train.py里168行partial_index的作用？ #4

请问train.py里168行partial_index的作用？ #4

Comments

zhishao commented Nov 29, 2023

zhishao commented Nov 30, 2023

Jason-Zhou-JC commented Dec 2, 2023 • edited Loading

zhishao commented Dec 4, 2023

zhishao commented Dec 10, 2023

Jason-Zhou-JC commented Dec 12, 2023 • edited Loading

Jason-Zhou-JC commented Dec 13, 2023

Jason-Zhou-JC commented Dec 2, 2023 •

edited

Loading

Jason-Zhou-JC commented Dec 12, 2023 •

edited

Loading