prepare output type/sr

2022-10-03 20:00:35 +05:30 · 2022-10-03 20:00:35 +05:30 · 5e5fd9d9b0
parent 07c525ca15
commit 5e5fd9d9b0
1 changed files with 16 additions and 1 deletions
--- a/enhancer/inference.py
+++ b/enhancer/inference.py
@ -18,6 +18,8 @@ class Inference:
        if isinstance(audio,(np.ndarray,torch.Tensor)):
            assert sr is not None, "Invalid sampling rate!"
            if len(audio.shape) == 1:
                audio = audio.reshape(1,-1)
        if isinstance(audio,str):
            audio = Path(audio)
@ -65,6 +67,8 @@ class Inference:
        window = get_window(window=window,Nx=data.shape[-1])
        window = torch.from_numpy(window).to(data.device)
        data *= window
        step_size = window_size//2 if step_size is None else step_size
        data = data.permute(1,2,0)
        data = F.fold(data,
@ -85,6 +89,17 @@ class Inference:
        else:
            wavfile.write(filename,rate=sr,data=waveform.detach().cpu())
    @staticmethod
    def prepare_output(waveform:torch.Tensor, model_sampling_rate:int,
        audio:Union[str,np.ndarray,torch.Tensor], sampling_rate:Optional[int]
    ):
        if isinstance(audio,np.ndarray):
            waveform = waveform.detach().cpu().numpy()
        if sampling_rate!=None:
            waveform = Audio.resample_audio(waveform, sr=model_sampling_rate, target_sr=sampling_rate)
        return waveform